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SOUCHE NEUROVIRULENTE DU VIRUS WEST-NILE 
ET SES APPLICATIONS 

La presente invention est relative a une souche neuroinvasive et 
neurovirulente du virus West-Nile, denommee IS-98-ST1, a des molecules d'acide 
5 nucleique issues de son genome, aux proteines et peptides codes par lesdites mole- 
cules d'acide nucleique ainsi qu'a leurs applications. 

La presente invention concerne egalement tous variants de la souche 
virale IS-98-ST1 ayant au moins une mutation dans la sequence nucleique corres- 
pondantaNSS. 

10 La famille des Flaviviridae regroupe les virus du genre flavivirus 

responsables de pathologies humaines graves telles que la dengue, la fievre jaune, les 
encephalites transmises par les tiques, l'encephalite japonaise, l'encephalite a 
West-Nile et les virus des hepatites C et G. Si les flavivirus sont susceptibles de 
provoquer une morbidite et une mortalite importantes chez Phomme, Pinfection est 

15 generalement asymptomatique et seule une fraction des individus infectes developpent 
une maladie grave. 

Les flavivirus sont des petits virus enveloppes. Leur genome est une 
molecule d'ARN monocatenaire de polarite positive d'environ 1 1 000 bases. L'ARN 
genomique est associe a plusieurs copies de la proteine de capside C pour former la 

20 nucleocapside; elle est entouree d'une enveloppe virale constitute d'une double couche 
lipidique issue des membranes du reticulum endoplasmique (RE) dans lesquelles sont 
ancrees la proteine d'enveloppe E et la proteine de membrane M. LARN genomique 
des flavivirus contient un unique cadre de lecture ouvert d'environ 10500 nucleotides 
flanque de deux courtes regions non codantes a ses extremites 5' et 3'. Le genome est 

25 traduit en une polyproteine d'environ 3400 acides amines qui est le precurseur des 
proteines structurales C , prM (le precurseur intracellulaire de M) et E dans sa partie 
N-terminale et d'au moins sept proteines non structurales (NS) de NS1 a NS5 dans sa 
partie C-terminale. 

Jusque tres recemment, le virus West-Nile etait reconnu comme un 

30 virus peu pathogeny responsable d'un syndrome grippal et present en Afrique, en 
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Europe du Sud et au Moyen Orient ; il a ete isole au cours d'epidemies, survenues 
notamment en Israel dans les annees 1950 et en Afrique du Sud dans les annees 1970. 

Tres recemment, Pepidemiologie du virus West-Nile s'est modifiee 
et un nombre croissant de cas d'encephalites a ete observe aux cours des epidemies 
5 survenues en Roumanie en 1996,.en Israel en 1998 et aux USA en 1999. 

Des souches pathogenes ont ete isolees lors de ces epidemies 
(Anderson et aL et Lanciotti et ah. Science, 1999, 286 : 2331-2333, 2333-2337), en 
particulier la souche NY 1999 (GenBank n°AF202541, Lanciotti et aL, precite), dont la 
pathogenicity serait correlee a la presence d'un site de glycosylation NTS dans la 
10 proteine d'enveloppe E (Jordan et al., Viral Immunol., 2000, 13, 4 : 435-446). 

Des facteurs viraux mal identifies pourraient etre responsables de la 
gravite de Pinfection, alors que la constitution genetique de Phote (humain ou non- 
humain) contribuerait a la resistance a Pinfection. 

Toutefois, les donnees relatives a ces souches pathogenes recemment 
15 isolees n'ont pas permis de determiner tous les facteurs viraux et les genes de Phote 
impliques dans la sensibilite/resistance a Pinfection par les Flaviviridae. 

Des modeles murins ont permis d'etablir Pexistence d'une resistance 
genetique a Pinfection par les flavivirus. II a ete montre que certaines lignees de souris 
recemment derivees de Petat sauvage et appartenant aux especes Mus musculus 
20 musculus ou Mus spretus (Det, BSVR, BRVR, PRI, CASA/Rk et CAST/Ei) sont 
resistantes a Pinfection par les flavivirus, alors que les lignees consanguines de labo- 
ratoire les plus courantes qui derivent majoritairement de Pespece Mus musculus 
domesticus , n'y resistent pas (Sangster et al, J.Virol., 1993, 67 : 340-347). 

La resistance est controlee par au moins un locus autosomal 
25 denomme Fh, localise sur le chromosome 5, chez la souris et trois alleles F/v 5 , Flv r et 
Flv mr conferent respectivement la sensibilite, la resistance et la resistance 
intermediaire a Pinfection par les flavivirus. En utilisant une souche du flavivirus de 
Pencephalite de la Vallee de Murray et des souris issues du croisement en retour de la 
lignee de souris resistante C3H/RV avec les lignees de souris sensibles C3/He ou 
30 BALB/c, le locus Flv a ete localise dans une region de 0,9 cM du chromosome 5, chez 
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la souris, entre les marqueurs D5MU68 et D5MU242 (G.R. Shellam et ah, Rev. Sci. 

Tech. Off. Epiz. 1998,17 :23 1-248.). 

Les Inventeurs ont maintenant isole une nouvelle souche du virus 

West-Nile, a partir cTechantillons preleves sur des cigognes en Israel (dans la ville 
5 d'Eilat) en septembre 1998, qui a ete selectionnee pour Fetude de la resis- 

tance/sensibilite d ? un hote (mammifere humain ou non-humain) a l'infection par les 

virus de la famille des Flaviviridae. 

Conformement a I' invention, ladite souche neurovirulente et 

neuroinvasive du virus West-Nile isolee, denommee IS-98-ST1, est caracterisee en ce 
10 que son genome est constitue par la sequence SEQ ID NO :1 qui code pour une 

polyproteine presentant la sequence SEQ ID NO : 2. 

Les Inventeurs ont notamment montre que les souris de laboratoire 

sont extremement sensibles a Pinfection par la souche IS-98-ST1 alors que les souris 

des lignees SEG, WMP, STF et MAI qui derivent de souris sauvages appartenant a 
15 des especes differentes bien que du meme genre Mus, sont completement resistantes a 

Tinfection par cette souche ; une inoculation par voie intraperitoneale de 1000 UFF 

(Unites Formant Foyer ; UFF:DL50 = 100) est mortelle a 100 % pour les souris de 

laboratoire, alors que les souris sauvages ne presentent aucun symptome ; en outre, le 

virus se replique chez ces souris, comme le montre Fapparition d'anticorps seriques 
20 specifiques. 

La presente invention a egalement pour objet des reactifs, derives de 
la souche IS-98-ST1, utilises pour Tetude et le diagnostic des infections par les F/av/- 
viridae, lesquels reactifs sont selectionnes dans le groupe constitue par les reactifs 
suivants : 

(a) une molecule d'acide nucleique choisie parmi la sequence SEQ 
ID NO :1, les fragments d'au moins 15 nucleotides de la sequence SEQ ID NO :1 et 
les sequences complementaires sens et anti-sens des sequences precedentes, a 
Pexclusion du fragment presentant la sequence GENBANK AF205882. 

(b) un vecteur recombinant comprenant une molecule d'acide 
nucleique telle que definie en (a), 
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(c) une cellule transformee par une molecule d'acide nucleique telle 
que definie en (a), un vecteur tel que defini en (b) ou une souche neurovirulente du 
virus West-Nile telle que definie en (a), 

(d) une proteine ou un peptide code par une molecule d'acide 
5 nucleique telle que definie en (a), 

(e) un anticorps polyclonal, susceptible d'etre obtenu par immunisa- 
tion d'un mammifere non-humain avec ia souche IS-98-ST1 du virus West-Nile telle 
que definie ci-dessus ; de maniere preferee, ledit mammifere non-humain est une 
souris homozygote pour Pallele Flv, resistance a I'infection par les Flaviviridae, et 

10 (f) un anticorps polyclonal ou monoclonal, susceptible d'etre obtenu 

par immunisation d'un mammifere non-humain avec un vecteur recombinant tel que 
defini en (b) ou bien une proteine ou un peptide, tels que definis en (d). 

Ces differents reactifs sont prepares et utilises selon les techniques 
classiques de biologie moleculaire et d' immunologic, en suivant les protocoles 
standards tels que ceux decrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and son Inc, Library of Congress, USA) et 
dans Current Protocols in Immunology (John E. Coligan, 2000, Wiley and Son Inc. 
Library of Congress, USA). 

Les fragments d'acides nucleiques tels que definis ci-dessus, en 
particulier ceux correspondant aux sequences SEQ ID NO: 3-11 sont utilises par 
exemple comme sonde ou comme amorce pour le diagnostic d'une infection par le 
virus West-Nile ; I'infection est detectee par exemple par PCR et/ou par hybridation, a 
partir des acides nucleiques extraits d'un echantillon biologique preleve chez un 
individu susceptible d'etre infecte ou un animal de laboratoire inocule par ledit virus. 

Selon un mode de realisation avantageux desdits fragments, ils 
comprennent au moins 15 nucleotides de la SEQ ID NO:l en amont ou en aval de Tun 
des codons en position suivante : 

codon Alanine (A) en positions 1117-1119, correspondant au 
residu en position 51 de la proteine E ou en position 341 de la sequence de la 
polyproteine virale de sequence SEQ ID NO:2 (la sequence de la proteine E s'etend 
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des codons en position 291 a 791 de la sequence SEQ ID NO:2, correspondants aux 
nucleotides 967 a 2469 de la sequence SEQ ID NO:1), 

codon Asparagine (N) en positions 2518-2520, correspondant au 
residu en position 17 de la proteine NS1 ou en position 808 de la sequence SEQ ID 
5 NO:2 (la sequence de la proteine NS1 s'etend des codons en position 792 a 1 144 de la 
sequence SEQ ID NO:2, correspondants aux nucleotides 2470 a 3528 de la sequence 
SEQ IDNO:l). 

codon Arginine (R) en positions 4018-4020, correspondant au 

residu en position 164 de la proteine NS2A ou en position 1308 de la sequence SEQ 
10 ID NO:2 (la sequence de la proteine NS2A s'etend des codons en position 1 145 a 1374 

de la sequence SEQ ID NO:2, correspondants aux nucleotides 3529 a 4218 de la 

sequence SEQ ID NO: 1), 

codons Glycine (G) en positions 4462-4464 et acide Glutamique 

(E) en positions 4465-4467, correspondant respectivement au residu en position 82 et 
15 83 de la proteine NS2B ou en position 1456 et 1457 de la sequence SEQ ID NO:2 (la 

sequence de la proteine NS2B s'etend des codons en position 1375 a 1505 de la 

sequence SEQ ID NO:2, correspondants aux nucleotides 4219 a 461 1 de la sequence 

SEQ ID NO:l), 

codons Proline (P) en positions 6097-6099 et acide Glutamique 
20 en positions 6172-6174, correspondant respectivement au residu en position 496 et 
521 de la proteine NS3 ou en position 2001 et 2026 de la sequence SEQ ID NO:2 (la 
sequence de la proteine NS3 s'etend des codons en position 1506 a 2124 de la 
sequence SEQ ID NO:2, correspondants aux nucleotides 4612 a 6468 de la sequence 
SEQ ID NO:l),et 

25 - codons Serine (S) en positions 7840-7842, Asparagine (N) en 

positions 8518-8520 et Alanine (A) en positions 8794-8796, correspondant 
respectivement au residu en position 54, 280 et 372 de NS5 ou en position 2582, 2808 
et 2900 de la sequence SEQ ID NO:2 (la sequence de la proteine NS5 s'etend des 
codons en position 2529 a 3430 de la sequence SEQ ID NO:2, correspondants aux 

30 nucleotides 7681 a 10386 de la sequence SEQ ID NO: 1). 
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De telles amorces sont utiles pour amplifier des fragments contenant 

lesdits codons. 

De maniere preferee, lesdites amorces sont situes entre 10 et 100 
nucleotides en amont ou en aval desdits codons. 
5 Selon un autre mode de realisation avantageux desdits fragments, ils 

sont constitues par les fragments comprenant les codons precites, de preference entre 
50 et 200 nucleotides, qui sont amplifies en utilisant les amorces telles que definies ci- 
dessus. 

Les vecteurs recombinants tels que definis ci-dessus, en particulier 
0 les vecteurs d'expression et les cellules transformees par lesdits vecteurs d'expression 
sont avantageusement utilises pour la production des proteines et des peptides corres- 
pondants. 



et/ou a induire la production d'anticorps specifiques du virus West-Nile, en particulier 
de souches neurovirulentes, sont utiles pour le diagnostic d'une infection par un virus 
West-Nile ; 1'infection est detectee par une technique appropriee, notamment EIA, 
ELISA, RIA, immunofluorescence a partir d'un echantillon biologique preleve chez 
un individu susceptible d'etre infecte ou un animal de laboratoire inocule par ledit 
virus. Les proteines et les peptides tels que definis ci-dessus sont egalement utilises 
pour la recherche de partenaires cellulaires de ces proteines virales susceptibles d'etre 
impliques dans la pathogenicity (neurovirulence) du virus West-Nile ; ces partenaires 
sont identifies par des techniques d'immunoaffinite, par exemple par chromatographic 
sur colonne d'immunoaffinite. 



infection par un virus West-Nile en particulier des souches neurovirulentes; 
1'infection est detectee par une technique appropriee, notamment EIA, ELISA, RIA, 
immunofluorescence a partir d'un echantillon biologique preleve chez un individu 
susceptible d'etre infecte ou un animal de laboratoire inocule par ledit virus. Parmi 
ceux-ci, les anticorps produits par immunisation de souris Flv/FW avec la souche IS- 
98-ST1 possedent avantageusement un titre eleve et une tres grande specificite pour le 
virus West-Nile. 



Lesdites proteines et lesdits peptides, qui sont aptes a etre reconnus 



Les anticorps selon I'invention sont utiles pour le diagnostic d'une 
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Les cellules transformees selon ['invention, en particulier les cellules 
neurales (neurones et cellules endothelials) infectees par une souche neurovirulente 
telle que definie ci-dessus, sont utilisees pour identifier les genes issus de ces cellules 
dont Fexpression pourrait etre modulee au cours de 1'infection virale ; ces genes sont 
5 detectes par exemple par la technologie des biopuces, selon les protocoles classiques 
tels que decrits dans « Atlas Mouse Arrays (#membranes) ATLAS™ NYLON cDNA 
EXPRESSION ARRAYS (CLONTECH, USA). 

La presente invention a egalement pour objet un modele d'etude de 
la sensibilite/resistance a I'infection par un virus de la famille des Flaviviridae, carac- 
10 terise en ce qu'il comprend au moins une souche neurovirulente du virus West-Nile 
telle que definie ci-dessus. 

Selon un mode de realisation avantageux dudit modele, il comprend 
en outre une souris homozygote pour 1'allele Flv r ou Flv\ 

La presente invention a egalement pour objet un procede de detec- 
15 tion d'une infection a Flaviviridae, notamment du virus West-Nile, caracterise en ce 
qu'il comprend : 

- ('amplification des ARN issus d'un echantillon biologique a tester 
a l'aide des amorces telles que definies ci-dessus, et 

- le sequen^age du produit d'amplification obtenu. 

20 Une telle detection peut avantageusement permettre le pronostic de 

la severite d'une encephalite virale a virus West-Nile. 

La souche neurovirulente du virus West-Nile selon l'invention est 
utilisee pour le criblage de genes cellulaires impliques dans la resistance d'un mammi- 
fere a I'infection par un virus de la famille des Flaviviridae, de preference le virus de 

25 Phepatite C. 

De maniere avantageuse, ledit procede de criblage comprend les 

etapes suivantes : 

- mise en culture de cellules derivees d'un hote (humain ou non- 
humain) selectionne pour sa resistance ou sa sensibilite a I'infection par un Flavivi- 

30 ridae, 

- infection in vitro desdites cellules par un Flaviviridae, et 
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- detection de genes exprimes de maniere differentielle dans lesdites 

cellules infectees. 

Conformement a I* invention, ladite detection peut comprendre 
I'etablissement du profll de transcrits ou de proteines a partir desdites cellules. 
5 La presente invention a egalement pour objet l'utilisation du modele 

tel que defini ci-dessus pour le tri de molecules actives contre une infection virale due 
a un virus de la rami lie des Flaviviridae. 

La presente invention a en outre pour objet un procede de tri de 
molecules actives contre une infection par un Flavivirus , caracterise par : 

- la mise en contact d'une culture de cellules eucaryotes, issues d'un 
mammifere (humain ou non-humain) sensible a Tinfection a un Flaviviridae avec une 
suspension virale de la souche selon la revendication 1, en presence ou en l'absence de 
la molecule a tester et 

- detection de Pamplification/replication du virus, par toute methode 
connue (quantification genome, ARNm, -proteines, particules virales). 

La presente invention a egalement pour objet un variant de la souche 
virale telle que definie ci-dessus, caracterise en ce que son genome comprend au 
moins une mutation dans la sequence nucleotidique correspondant a la proteine NS5. 

Outre les dispositions qui precedent, Pinvention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre de Tobjet de la presente invention, ave references aux 
dessins annexes dans lesquels : 

- les figures 1A a IE representent la comparaison de la sequence en 
acides amines des proteines virales de la souche IS-98-ST1 (SEQ ID NO : 2), isolee a 
partir de cigognes (CI) et de la souche New York (NY99 ; Genbank AF196835) isolee 
a partir de flamands roses (FLA), lors de l'epidemie de 1 999 aux Etats-Unis, 

- la figure 2 represente la cinetique de mortalite et la cinetique 
d'apparition des anticorps seriques specifiques chez des souris sensibles Flv s /Fh s 
(BALB/c), infectees par la souche IS-98-ST1 du virus West-Nile, 

- la figure 3 represente la cinetique de propagation de la souche IS- 
98-ST1 dans le systeme nerveux central des souris sensibles Flv $ /Flv s (BALB/c), 
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- les figures 4 (A. B et C) representent la cinetique d'apparition des 
antigenes viraux dans les cellules Neuro 2a et les neurones primaires de souris 
sensibles (BALB/c) infectees par le virus West-Nile (souche IS-98-ST1), 

- la figure 5 represente la mort par necrose des cellules Neuro 2a 
5 infectees par le virus West-Nile (souche IS-98-ST1), 

- la figure 6 represente le protocole experimental utilise pour preci- 
ser la localisation du locus Flv sur le chromosome 5 de la souris, 

- la figure 7 represente la carte genetique du locus Flv, determinee a 
partir de souris sensibles, issues du premier croisement en retour entre les lignees 

10 resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 ou BALB/c). Les 
boites blanches representent les alleles BALB/c ou C57B1/6 et les boites noires repre- 
sentent les alleles MAI/Pas ou MBT/Pas. 

- la figure 8 represente la carte genetique du locus Flv determinee a 
partir des souris resistantes et sensibles, issues du premier croisement en retour (BC1) 

15 entre les lignees resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 
et BALB/c). Les lignes grisees representent les alleles (BALB/c ou C57B1/6) et les 
lignes noires representent les alleles MAI/Pas ou MBT/Pas, 

- la figure 9 represente la carte genetique et la carte physique du 
locus Flv et la position du gene OAS dans ce locus, et 

20 - la figure 10 represente la distribution des alleles Flv chez les souris 

resistantes et sensibles issues du premier croisement en retour (BC1) entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 et BALB/c). 
Exemple 1 : Isolement, amplification, purification et titration de la souche 
neuroinvasive du virus West-Nile IS-98-ST1 

25 Un isolat du virus West-Nile (WN) a ete obtenu a partir du systeme 

nerveux central d'une cigogne manifestant des troubles neuropathologiques severes, en 
septembre 1998, a Eilat (Israel). L'infection de cellules VERO par cet isolat est cyto- 
lytique et rimmunofluorescence indirecte avec un ascite de souris immun specifique 
du virus West-Nile (serum immun de reference WN 8907) est positive a 100 %. Le 

30 virus produit sur cellules VERO a ete recolte et amplifie sur cellules de moustiques 
AP61 (Despres et al.. Virol., 1993, 196 : 209-219) 
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Le Passage 1 (ou PI) du virus WN sur cellules AP61 a ete recolte 3 
jours apres linfection ; il possede un titre de 2,5 x 10 8 UFF/ml (Unite Formant Foyer) 
par la technique de titration sur cellules AP61 decrite dans Despres et al (precite). 
L'inoculum PI du virus WN sur cellules AP61 a ete identifie comme la souche IS-98- 
5 ST1. 

Un P2 a ete obtenu a partir de cellules AP61 infectees par la souche 
IS-98-STL PI (titre: 6 x 10 7 UFF/ml). L'inoculum P2 de IS-98-ST1 est utilise pour les 
epreuves de sensibilite a V infection virale chez des souris adultes. 

Un inoculum viral P3 de la souche IS-98-ST1 avec un titre de 5 x 

10 10 7 UFF/ml a ete produit sur cellules AP61. Une preparation virale hautement puri- 
fiee, preparee selon le protocole de purification des flavivirions decrit dans Despres et 
al., 1993) a ete obtenue a partir de 20 boites de 150 cm 2 de cellules AP61 recoltees 3 
jours apres Hnfection par l'inoculum P3 du virus WN souche IS-98-ST1 (multiplicity 
d'infection de 0,4). La souche IS-98-STI purifiee en gradients de saccharose a un titre 

15 final de 2 x 10 10 UFF/ml. Les ARN extraits de ce virus purifie sont utilises pour 
amplifier les ADNc correspondant aux proteines virales C, prM et NS1 ou aux 
sequences non codantes aux extremites 5' et 3' du genome viral. 
Exemple 2 : Sequen^age du genome de la souche neuroinvasive IS-98-ST1 

Le genome viral a ete extrait a partir du surnageant de culture des 

20 cellules VERO infectees de Texemple 1 a l'aide du kit "QIAamp Viral RNA " 
(QIAGEN), en suivant les instructions du fabricant. 6 produits RT-PCR chevauchants 
ont ete amplifies a partir de ces ARNs en utilisant les amorces decrites par Lanciotti et 
al. (precite). Les extremites 5' et 3 J du genome viral ont ete amplifies respectivement 
a l'aide des amorces suivantes: 

25 - 5* AGTAGTTCGCCTGTGTGAGCTGACAAAC 3' (SEQ ID NO:5), et 
- 5' AGATCCTGTGTTCTCGCACCACCAGCCAC 3' (SEQ ID NO:6). 

L'ADNc correspondant a la proteine virale E a ete amplifie a l'aide 
des amorces 5' GGATGGATGCT(A/T)GG(G/T)AGCAAC 3' (SEQ ID NO:7) et 5 f 
CCATCCAAGCCTCCACATC 3' (SEQ ID NO:8), s'hybridant respectivement dans le 

30 gene de la proteine M (positions 889 a 909 de la sequence SEQ ID NO:l) et dans le 
gene de la proteine NS1 (positions 2539 a 2557 de la sequence SEQ ID NO:l). 
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Les ADNc obtenus ont ete purifies par chromatographie echangeuse 
d'ions et precipites dans 2 volumes d'isopropanol. Ensuite les ADNc ont ete sequen- 
ces sur les deux brins en utilisant le kit iS Taq Dye Deoxy Terminator Cycle 
Sequencing" (PERiON ELMER CORP./APPLIED BIOSYSTEM) et les amorces 
5 espacees de 400 paires de bases sur le genome viral (Lanciotti et al., precite). Le 
sequen^age a ete realise avec 0.2.pmoles d'ADNc purifle et 30 pmoles d'amorces, en 
suivant le protocole recommande par le fabricant. L'alignement des sequences est 
realise a l'aide du logiciel CLUSTAL W. 

La sequence genomique complete de la souche IS-98-ST1 du virus 
10 West-Nile correspond a la sequence SEQ ID NO : 1 . 

L'alignement des sequences en acides amines de la souche IS-98- 
ST1 (Seq ID NO : 2) et de la souche NY99. presentee a la figure 1, montre que la 
souche IS-98-ST1 isolee en Israel en 1998 et la souche NY-99 isolee a New York en 
1999 sont tres proches (divergence de moins de 0,2% au niveau des sequences en 
15 acides amines). 

Cependant. les differences observees dans la souche IS-98-ST1, 
respectivement dans les proteines E (A 5 |) ? NS1 (N| 7 ), NS2A (Rim), NS2B (Gg 2 , E 83 ), 
NS3 (P 496 , E521) et NS5 (S 54 , N?8o, A372) sont potentiellement responsables de la 
neurovirulence et des proprietes neuroinvasives observees avec cette souche et 
20 peuvent servir de marqueur de virulence du virus West-Nile. 

Exemple 3 : Clonage des proteines de la souche neuroinvasive IS-98-ST1 et utili- 
sations des plasmides recombinants obtenus. 

1 - La proteine C 

L'ARN genomique extrait des virions IS-98-ST1 purifies sur 
25 gradients de saccharose decrits a Texemple 1, a Taide de la solution RNA PLUS 2 
(Q.BIOGEN). est utilise comme matrice pour amplifier la sequence codant pour la 
proteine C (acides amines I a 123) par la technique RT-PCR (kit Titan One Tube RT- 
PCR; Roche Biochemicals #1939 823). 
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Le couple cfamorces utilise sur la matrice ARN est le suivant : 



• 5 5 C/WNV (sequence des nt 81-1 17 de la sequence SEQ ID NO:l) 

5 ; TAG CAC GAA GAA TTC GAT GTC TAA AAA CCA GGA GGG 3 5 (SEQ ID NO: 1 1) 
qui contient le site de restriction EcoRl, et 

5 • 3'C/WNV (sequence anti-sens des nt 433 a 482 de la sequence SEQ ID NO:l) 

5 ! AAGTTAGCCCGGGTTAATGCTCCTACGCTGGCGATCAGGCCAATCAGGAC 3' 

(SEQ ID NO:4) qui contient le site de restriction Sma I. 



123) du virus WN a ete clone d'une part entre les sites EcoRl et Sma\ du plasmide pCI- 
10 neo (Promega ft El 841) et d'autre part entre les sites Kspl et Smal du plasmide pIVEX 
2.4a (Roche). 



Collection Nationale de Culture de Microorganismes de PInstitut Pasteur de Paris, 
28, rue du Docteur Roux, 75724, PARIS Cedex 15 sous le numero 1-2688) contient la 

15 sequence complete du gene de la proteine C de la souche IS-98-ST1 du virus WN 
entre les promoteurs T7 et T3. La transcription in vitro de pCI-C/WN linearise par 
Nhel sous la dependance du promoteur T3 synthetise un ARN d'environ 350 bases 
complementaires de la sequence virale genomique. La ribosonde marquee a la DIG 
(digoxigenine) est utilisee pour la detection des ARN viraux sens positif presents dans 

20 les cellules infectees par le virus WN, par la technique d'hybridation in situ, selon le 
protocole decrit dans Despres et ai,(J. Virol, 1998, 72 : 823-829). 



tion massive de la proteine C (acides amines 1 a 123) du virus WN en lysat bacterien 
(systeme RTS 500 de Roche). La proteine recombinante C produite in vitro possede a 
25 son extremite N-terminale une sequence [His] 6 et le site de clivage reconnu par la 
protease Xa pour permettre d'une part sa purification sur colonne de Ni et d'autre part 
l'elimination des residus histidines. La proteine C de la souche IS-98-ST1 du virus 
WN ainsi produite est utilisee pour des etudes structurales, pour la recherche de parte- 
naires cellulaires de cette proteine en colonne d'immunoaffinite, et pour la production 



L'ADNc de la proteine C de la souche IS-98-ST1 (acides amines 1 a 



Le plasmide recombine pCI-C/WN (depose le 21 juin 2001 a la 



Le plasmide recombinant pIVEX-C/WN est utilise pour la produc- 
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d'anticorps monospecifiques chez le lapin. 

2- La proteine M 

Les ADNc de la souche IS-98-ST1 du virus WN codant pour la 
proteine M (acides amines 215 a 290 de la polyproteine virale) ou son ectodomaine de 
5 41 acides amines (acides amines 21 5 a 255; acronyme ectoM) sont clones : 

(1) en phase avec Pextremite C-terminale de PEGFP dans le 
plasmide p(95-t I4]EGFP, derive du plasmide pEGFP-Nl (Clontech) qui comprend 
les residus 95-1 14 de la proteine C du virus de la dengue de type 1 (souche BR/90) 
fusionnes en phase avec la sequence N-terminale de la proteine EGFP[21 5-290] WNV, 

10 pour donner le plasmide p[95-l 14]EGFP[2 15-290] WNV, 

(2) dans le plasmide pIVEX (systeme RTS 500 de Roche) pour 
donner le plasmide pIVEX[EGFP][21 5-255] WNV, 

(3) dans le vecteur retroviral TRIPdeItaU3CMV, pour donner le 
plasmide TRlPdeltaU3CMV[95-l 14]EGFP[2 15-255] WNV. 

15 Le plasmide pIVEX[EGFP] [2 15-255] WNV permet la synthese 

acellulo et la purification de la proteine chimerique EGFP-ectoM WNV qui est utilisee 
d'une part pour la production d'anticorps monospecifiques diriges contre la proteine M 
du virus WN et d'autre part pour la recherche de partenaires cellulaires de la molecule 
ectoM WNV en colonne d'immunoaffinite. 

20 Le plasmide TRIPdeltaU3CMV[95-l 14]EGFP[215-255]WNV est 

cotransfecte dans des cellules 293T avec les plasmides 8.7 et G-VSV pour produire 
des particules virales pseudotypees par I'enveloppe G du virus de stomatite vesiculate 
(VSV), contenant les proteines internes du virus de rimmunodeficience acquise (VIH) 
et des molecules d'ARN chimeriques CMV[95-114]EGFP[2 15-255] WNV. L'infection 

25 des cellules cibles par le vecteur recombine non replicatif permet I'integration dans le 
genome cellulaire de I'ADN CMV[95-1 14]EGFP[215-255]WNV et Texpression stable 
de I'ectodomaine de la proteine M-WN sous le controle du promoteur CMV. 

3- La proteine NS1 

L'ARN genomique extrait des virions IS-98-ST1 purifies est ampli- 
30 fie par la technique RT-PCR (kit Titan One Tube RT-PCR; Roche Biochemicals 
#1939 823) a I'aide du couple d'amorces suivant: 
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- 5TGGATGGGATCCAATATGCGTGATAGGTCC 3' (SEQ ID NO:9) qui contient 
le site de restriction BamHl et 

- 3 ? AAAAGGGTCAATGGTACCAGCATTTTAAGCATTCACGTT 3' (SEQ ID 
NO: 10) qui contient le site de restriction Kpnl. 



(acides amines 767 a 1 143 de la polyproteine virale est clone entre les sites BamHl et 
Kpnl du vecteur retroviral TRIPdeltaU3 pour produire le plasmide recombine 
TRIPdeItaU3-CMV-NSl-WN (depose le 9 janvier 2002 a la Collection Nationale de 
Culture de Microorganismes de Flnstitut Pasteur de Paris, 28 rue du Docteur ROUX, 

10 75724, PARIS Cedex 15 sous le numero 1-2770). Le plasmide TRIPdeItaU3-CMV- 
NS1-WN est cotransfecte dans des cellules 293T avec les plasmides 8.7 et G-VSV 
pour produire des particules virales pseudotypees par Tenveloppe G du virus de 
stomatite vesiculate (VSV), contenant les proteines internes du virus de 
l'immunodeficience acquise (VIH) et des molecules d'ARN chimeriques CMV-NS1- 

15 WN. L'infection des cellules cibles par le vecteur recombine non replicatif permet 
Integration dans le genome cellulaire de I'ADN CMV-NS1-WN et l'expression stable 
de la proteine NS1 du virus WN sous le controle du promoteur CMV. La proteine NS1 
de la souche IS-98-ST1 du virus WN ainsi produite est utilisee pour des etudes 
structurales. pour la recherche de partenaires cellulaires de cette proteine en colonne 

20 d'immunoaffinite, et pour la production d'anticorps monospecifiques chez le lapin. 

Exemple 4 : Les souris sauvages et de lignees consanguines de laboratoire se 
differencient par leur sensibiiite a ['infection par la souche neuroinvasive IS-98- 
ST1 du virus West-Nile. 

1- Les lignees de souris et les cellu les sensibles. 

25 a) lignees de souris sensibles 

Des souris de lignees consanguines sensibles Flv s (BALB/c) agees 
de 6 semaines sont inoculees par la voie intraperitoneale avec 100 UFF de la souche 
IS-98-ST1 virus West-Nile (UFF:DL50 = 10), preparee comme decrit a Texemple 1. 

Ces souris meurent a 1 00% avec un temps moyen de mortalite de 9 ± 

30 2 jours (Figure 2). 

La cinetique de propagation de la souche IS-98ST1 dans le systeme 



5 



L'ADNc codant pour la glycoproteine NS1 avec son peptide signal 
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nerveux central de la souris sensible (BALB/c) a ete analysee a partir des extraits de 
cerveau des souris infectes titres sur cellules AP6I, selon la technique decrite dans 
selon la technique decrite dans Despres et al. (J. Virol, 1998, 72, 823-829). Les 
resultats montrent que le virus est detecte dans le systeme nerveux central (SNC) 
5 murin au 5 e,ne jour de I'infection et la production virale est maximale au 7* mc jour 
(Figure 3). Au 9* mc jour de ('infection, le virus n'est plus detecte dans le SNC murin 
(Figure 3). 

La replication du virus WN dans le SNC et les organes peripheriques 
des souris infectees par la souche IS-98-ST1 est egalement detectee par immuno- 
10 histologie, selon les protocoles classiques tels que decrits dans Despres et al., 1998 
(precite) et par hybridation in situ, selon les protocoles decrits a Pexemple 3. 

Les anticorps seriques specifiquement diriges contre les proteines du 
virus WN sont titres par ELISA selon le protocole decrit dans Despres et al., 1993 
(precite), en utilisant la souche IS-98-ST1 purifie sur gradient de saccharose telle que 
15 decrite a Pexemple K comme antigene. Les resultats montrent que les anticorps 
seriques apparaissent au 5 emc jour de I'infection et sont signifkativement detectes au 
7 6mc jour (figure 2). 

b) cellules sensibles 

bl) cultures primaires 

20 Des neurones primaires et des astrocytes du SNC de souris sensibles 

homozygotes pour Pallele Flv s (souris Swiss, Janvier) sont prepares selon les proto- 
coles classiques. Les cellules sont infectees par la souche IS-98-ST1 a une multiplicite 
d'infection de 20 UFF par cellule (m.L de 20). L'effet cytopathique est observe en 
microscopie optique. la production virale est analysee par titration sur cellules AP61 

25 comme decrit precedemment a l'exemple I et Texpression des antigenes viraux est 
analysee par radioimmunoprecipitation a Taide d'un serum immun de souris anti- 
West-Nile, selon les protocoles classiques tels que decrits dans Duarte Dos Santos et 
al. (Virology, 2000. 274 : 292-308). 

Les resultats montrent que 80% des neurones en culture produisent 

30 les antigenes viraux : 

- leur profil en gel de polyacrylamide-SDS est presente a la figure 
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4A. 

- la production virale est de [3.0 ± 1,5] x I0 6 UFF/ml apres 20 h 
defection et de [7,0 ± 0.5] x 10 7 UFF/ml a 40 h. 

- les effets cytopathiques (ECPs) de type necrotique sont observes 
5 apres 48 h d'infection virale. 

En revanche, les astrocytes du SNC murin ne sont pas permissifs a la 
replication du virus WN souche IS-98-ST1. 

b2> lignees cejjulaires 

Des cellules de neuroblastome murin Neuro 2a et des cellules 

10 d'hepatome humain HepG2, cultivees dans les conditions classiques telles que decrites 
dans Marianneau et al. (J. Virol., 1996, 77 : 2547-2554) sont infectees a differentes 
multiplicity d'infection par le virus WN souche IS-98-ST1, prepare comme decrit a 
Fexemple I. I/effet cytopathique est observe en microscopie optique, la production 
virale est analysee par titration sur cellules AP61 comme decrit precedemment a 

15 Fexemple I et 1'expression des antigenes viraux est analysee par radioimmuno- 
precipitation a Taide d ? un serum immun de souris anti- West-Nile, selon les protocoles 
classiques tels que decrits dans Duarte Dos Santos et al., Virol., 2000, 274,292-308. 

Les resultats montrent que les cellules de neuroblastome murin 
Neuro 2a sont permissives a la replication de la souche IS-98-ST1 du virus WN. Une 

20 m.i. de 4 est necessaire pour infecter 80% des cellules Neuro 2a en monocouche. La 
production virale est de 10 7 UFF/ml (m.i. de 4) apres 40 h d'infection et la mort cellu- 
laire par necrose est massive (Figure 5). La cinetique de production des antigdnes 
majeurs prM, E et NSl a partir de la polyproteine virale presentee dans la figure 4B. 
montre que le demi-temps de formation de la glycoproteine d'enveloppe E est 

25 d'environ 30 min. La proteine E de la souche IS-98-ST1 semble ne posseder qu'un 
seul residu N-glycanne (figure 4C). 

Les resultats montrent egalement que les cellules d'hepatome humain 
HepG2 sont permissives a la replication de la souche IS-98-ST1 du virus WN. A une 
m.i. de 10, la production virale est de [2 ± 1] x 10 6 UFF/ml apres 48 h d'infection et les 

30 ECPs sont observes a partir de 72 h. 

2- Les souri s resistances, 
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Les lignees de souris resistantes (Flv r ) qui derivent de souris 
sauvages de Tespece Mm spretus (SEG/Pas et STF/Pas), Mus musculus musculus 
(MBT/Pas, MAI/pas). Mus musculus domesticus (WMP/Pas), sont inoculees par la 
voie intraperitoneale. avec 1000 UFF (100 DL50) de la souche IS-98-ST1 preparee 
5 selon le protocole decrit a Texemple 1 . 

Contrairement aux souris de laboratoire qui sont sensibles a 
Tinfection par la souche IS-98-STI et meurent en une dizaine de jours, ces souris 
derivant de souris sauvages sont resistantes a l'inoculation de la souche IS-98-ST1 et 
neanmoins permissives a la replication de la souche IS-98-STI. En effet, Tinfection 
10 virale des souris derivant de souris sauvages est asymptomatique bien que le virus se 
multiplie in toto comme le demontre la production d'anticorps seriques anti-WN a 
hauts titres ; en ELISA, les titres des serums a la dilution 1:100 pour 10 6 UFF de 
virion purifie IS-98-ST1 sont superieurs a 1 unite de D.O. a 450 nm. 

Les souris resistantes a Tinfection virale sont utilisees pour la pro- 
15 duction de serums immuns specifiquement diriges contre les proteines de la souche IS- 
98-ST1 du virus WN. Trois semaines apres inoculation du virus WN, les serums pre- 
leves de souris resistantes (0 ? 045 ml par souris) sont melanges, decomplementes 30 
min a 56°C puis dilues au 1 :10 dans du DPBS* ( v / v ) supplemente avec 0,2% ( v / v ) de 
Serum Albumine bovine (Life Technologies) et 0,05% ( P / v ) d'azide de sodium. Les 
20 serums dilues sont repartis en 0,2 ml et conserves a -20°C. Les serums immuns diriges 
contre la souche IS-98-ST1 sont utilises aux dilutions finales de 1:500 pour Timmuno- 
fluorescence indirecte et au 1:1000 pour Timmunoprecipitation des proteines virales 
radiomarquees. 

Exemple 5 : Utilisation de la souche IS-98-ST1 du virus West-Nile pour identifier 
25 les genes cellulaires impliques dans la sensibilite de 1'hote a Tinfection aux virus 
de la famille des Flaviviridae. 

1) Methodes 

a) Modele d'analvse de la resistance a Tinfection par les Flaviviridae 

(figure 6) 

30 Des souris males des lignees resistantes MAI/Pas et MBT/Pas sont 

croisees avec des souris femelles des lignees sensibles C57BL/6 et BALB/c. Les souris 
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males de la generation Fl sont croisees en retour avec des souris femelles des lignees 
sensibles C57BL/6 et BALB/c pour donner une generation de souris de premier 
croisement en retour (BC 1 ). 



5 peritoneale avec la souche IS-98-ST1, preparee selon le protocole decrit a l'exemple 1, 
dans les conditions decrites a fexemple 2. 



genomique a Paide d'amorces specifiques de 16 microsatellites du chromosome 5 
(Catalogue Research Genetics) entourant le locus Flv (figures 7-9), selon les 
techniques courantes de biologie moleculaire en utilisant les protocoles standards tels 
que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 
1 5 AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). 
2) Resultats 

L/analyse de la distribution des alleles Flv chez les souris BC1 
sensibles et resistantes a I'infection par la souche IS-98ST1 montre qu'un allele Flv x 
est suffisant pour conferer la resistance a I'infection (figure 10). Les resultats montrent 
20 egalement que dans ce modele il existe une correlation parfaite entre le phenotype 
resistant et la presence de Pallele Flv r et une correlation presque parfaite entre le 
phenotype sensible et Tabsence de Pallele Flv* (figure 10). 

Le genotypage des alleles Flv montre que le locus Flv est localise 
dans une region de 0.2 cM contenant le gene OAS1 (figures 7-9). 



Des souris BC1 agees de 5 semaines sont inoculees par voie intra- 



10 



Les animaux sont observes tous les jours et les taux de mortalite et 
de survie sont determines 14 jours apres I'infection. 

b) genotypage des alleles Flv 
Les alleles Flv des individus BC1 ont ete cartographies par PCR 
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REVINDICATIONS 

1°) Souche isolee du virus West-Nile, caracterisee en ce que son 
genome est constitue par la sequence SEQ ID NO :1 . 

2°) Molecule cTacide nucleique, caracterisee en ce qu'elle est selec- 
5 tionnee dans le groupe constitue par la sequence SEQ ID NO :1, les fragments d'au 
moins 15 nucleotides de la sequence SEQ ID NO :1 et les sequences complementaires 
sens et anti-sens des sequences precedentes, a I'exclusion du fragment presentant la 
sequence GENBANK AF205882. 

3°) Molecule d ? acide nucleique selon la revendication 2, caracterisee 
10 en ce qu ? elle est choisie dans le groupe constitue par les amorces comprenant au 
moins 15 nucleotides de la sequence en amont ou en aval de Tun des codons 
correspondant aux positions suivantes dans la sequence nucleotidique SEQ ID NO:l: 

- codon Alanine en positions 1117-1119 (position 51 dans la 
sequence en acides amines de la proteine E), 

15 - codon Asparagine en positions 2518-2520 (position 17 de la 

sequence en acides amines de la proteine NS1), 

- codon Arginine en positions 4018-4020 (position 164 de la 
sequence en acides amines de la proteine NS2A), 

- codons Glycine en positions 4462-4464 et acide Glutamique en 
20 positions 4465-4467 (positions 82 et 83 de la sequence en acides amines de la proteine 

NS2B), 

- codons Proline en positions 6097-6099 et acide Glutamique en 
positions 6172-6174 (positions 496 et 521 de la sequence en acides amines de la 
proteine NS3). et 

25 - codons Serine en positions 7840-7842, Asparagine en positions 

8518-8520 et Alanine en positions 8794-8796 (positions 54, 280 et 372 de la sequence 
en acides amines de la proteine NS5). 

4°) Molecule decide nucleique selon la revendication 2, caracterisee 
en ce qu'elle est choisie dans le groupe constitue par les fragments, de preference entre 

30 50 et 200 nucleotides, amplifies en utilisant les amorces selon la revendication 3. 
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5°) Vecteur recombinant, caracterise en ce qu'il comprend une mole- 
cule cTacide nucleique selon Tune quelconque des revendications 2 a 4. 

6°) Cellule eucaryote, caracterisee en ce qu'elle est transformee par 
une molecule d'acide nucleique selon Tune quelconque des revendications 2 a 4, un 
5 vecteur selon la revendication 5 ou une souche neurovirulente du virus West-Nile 
selon la revendication I . 

7°) Proteine ou peptide, caracterise en ce qu'il est code par une 
molecule d'acide nucleique selon Tune quelconque des revendications 2 a 4. 

8°) Anticorps polyclonal, caracterise en ce qu'il est susceptible 
10 d'etre obtenu par immunisation d'un mammifere non-humain avec la souche selon la 
revendication 1. 

9°) Anticorps selon la revendication 8, caracterise en ce que ledit 
mammifere non-humain est une souris homozygote pour I'allele Flv T de resistance a 
1' infection par les virus de la famille des Flaviviridae. 
15 10°) Anticorps polyclonal ou monoclonal, caracterise en ce qu'il est 

susceptible d'etre obtenu par immunisation d'un mammifere non-humain avec un vec- 
teur recombinant selon la revendication 5 ou bien une proteine ou un peptide, selon la 
revendication 7. 

11°) Modele d'etude de la sensibilite/resistance a l'infection par un 
20 virus de la famille des Flaviviridae, caracterise en ce qu'il comprend au moins une 
souche neurovirulente du virus West-Nile selon la revendication 1. 

12°) Modele d'etude selon la revendication 11, caracterise en ce 
qu'il comprend en outre une souris homozygote pour I'allele Flv r ou Flv\ 

13°) Procede de detection d'une infection a Flaviviridae, notamment 
25 du virus West Nile, caracterise en ce qu'il comprend : 

- ['amplification des ARN issus d'un echantillon biologique a tester 
en utilisant comme amorces des molecules d'acide nucleique selon la revendication 3, 
et 



tance d'un mammifere a Tinfection par un virus de la famille des Flaviviridae, caracte- 



30 



- le sequen^age du produit d'amplification obtenu. 

14°) Procede de criblage de genes cellulaires impliques dans la resis- 
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rise en ce qifil comprend les etapes suivantes : 

- mise en culture de cellules derivees d ? un hote (humain ou non- 
humain) selectionne pour sa resistance ou sa sensibilite a Finfection par un Flavivi- 
ridae, 

5 - infection in vitro desdites cellules par un Flaviviridae, 

- detection de genes exprimes de maniere differentielle dans lesdites 

cellules infectees. 

1 5°) Utilisation du modele selon la revendication 1 1 ou la revendica- 
tion 12, pour le tri de molecules actives contre une infection virale due a un virus de la 
1 0 famille des Flaviviridae. 

16°) Procede de tri de molecules actives contre une infection par un 
Flavivirus, caracterise par : 

- la mise en contact d'une culture de cellules eucaryotes, issues d'un 
mammifere sensible a Pinfection a un Flaviviridae avec une suspension virale de la 

15 souche selon la revendication 1 , en presence ou en V absence de la molecule a tester et 

- detection de la replication du virus. 

1 7°) Variant de la souche virale selon la revendication 1, caracterisee 
en ce que son genome comprend au moins une mutation dans la sequence 
nucleotidique correspondant a la proteine NS5. 
20 18°) Molecule d'acide nucleique selon la revendication 2, 

caracterisee en ce qu'elle est selectionnee dans Ie groupe constitue par les sequences 
SEQ ID NO :3-ll. 
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ci 

FLA 



c: 
fla 



ci 

TLA 



CI 

fla 



c: 

FLA 



CI 
TLA 



CI 
TLA 



CI 
FLA 



c: 

FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



C 

MS XXPGG ?GXS RA VNML XRGM ? R VLS L I G L X ?*AMLS L I DG KG ? I R FVLAL 
MS KK?GG ?GKS RA VNML XRGM ? R V LS L I G LKRAML S L I DG KG ? I R FVLA.L 



LAFFRFTAIArTRAVLD^WRGVNKQTAHKHLLSFKKFLGTLTSAI^RRSS 
LAF FR FT AI A ?7 RA V L DRW RG VN KQT AMKH LLS FXKF LG ? LT S AI N RR S S 

prM 

KQKKRGGKTG IAVM I GL I AS VGA VT LS N FQGKVMHT VNAT OVT OVI T I ?T 
KQKKRGGKTG IAVMIGL IAS VGAVTLSN FQGKVMMT VN'ATDVTDVI II FT 



AAG KN LC I VRAMD VG YMC D DT I T Y£ C ? VLS AGN D ?£ D I DCWCT KS A V Y VR 
AAG XNLC I VRAMDVG YMC D DT I T Y£C ? VLS AGN D?£ D I DCWCT KS AV Y VR 



M 

YG RCTK7RH S RRS RRS LT VQT KG£ S TLAN KKGAWMOS T KATR YL VKT £ S W 
YG RCT KT RH S RRS RRS L 7 VQT HG£ S T LA.N KKGAWMDS T KATR YL VKT £SW 

£ 

I LRN ?G YAL VAAVI GWMLG S N'TMQRWFVVLLLLVAPAYS FNCLGMS NRD 
I LRN ?G : AL V.-A.V IGWMLGS N T TMQR WFVVLLLL V'AFA Y5 ?$CLG>IS NR D 



FL£G VSGATWVDL VL£G DSCVT I MSKDKPT I DVKMMNM£AA.NLA£VRS YC 
FL£GVSGATWVDLVL£GD£CV7IMSKDK?TI DVK>iMNM£AVNLA£VRS YC 



YLAT V5 DL S T KAAC ? TMG SAH N D KRAD ? A FVCRQG W D RGWG MGCG LFG K 
YLAT VS DL S 7KAAC ?TMG£ AKN DKRADPArVCRQG Vv'DRGWGNGCGL F G K 



GSIDTC.^<FACST:^.IG=7ILKF>:i:<Yrv\AIFVHG?TTVISHGNYSTQVG 
• GSI DTCAKFACS7XAIGR7ILKFNI KY£V\AI FVHG?7?V£SHGNYSTQVG 



A7QAGRFS I T ? AA.P S YT LXL G £ YG £ VT V DC £ ? RSG I DTN'AYYVMTVGTKT 
ATQAGRFS I T PAAP5 Y7 LKLG£ Y GZVTvDC £ ? R5G I DT NA Y YVM7 VG7 K7 



FLVHR£WFM^LNX?WSSAGSTVlvRNR£TLM£F££?HATKOSVIALGSQ£G 
FLV--:R£WFMDLNL?a ? SSAGSTVWRNR£?LM£FF£?:-:ATKQSVIALGSQ£G 



AL HQ ALAG A I ? V£ FS S N T VKL T S G H L KC RVKMFKLQL KG 77 YGVC S KAFK 
ALKQALP.G A I r V£ FS 5 N T VKL T S G H L KC R VKM£ KLO L KG T T YG V C 5 KA F K 



F LG T ? ADTG HG 77V L £ LQ : 7 3 7 DG ?C KV ? I S S VA 5 L N DL 7 ? VG RL V 7 VM ? 
FLG7?AD7GHG7VVL£LQ:TGTDG?C:^/?ISSVASLN-DL7?VGRLV7VN? 



FVSVATANAKVLI£L£??F3DSYIVVGRG£QQIMHKWHKSGSSIG^FTT 
FVS VA T AN AKV LI£L£??FGDSYI V VG RG £ QQ I N* H H W H X S G S S I G KA F 7 T 
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CI TLKGAQRLAALGDTAWDFGSVGGVFTSVGKAVHQVFGGAFRSLFGGMSWI 
FLA 7LKGAQRLMLGDTAWDFGSVGGVFTSVGKAVHQVFGGAFRSLFGGMSWI 



NSi 

CI 7QGLLGALLLWMG I NARDRS I ALT FLAVGGVLL FLS VN VKAD7GCAI 01 S 

FLA T0GLLGALLLWMGINARDRSIALTFLAVGGVLLFLSVWHA0TGCAICI5 



CI RQCLRCGN'G VT I HNDVIAWMDRYKYV PET ?QG LAKI I QK.-..HKEGVCG LRS 

FLA RQELRCGSGVF I K NCVEAWMDR YKY Y ? £T PQGLAKI Z QKAKKEGVCGLRS 



CI VS RL E KQMWEAVXDE LN7 LL KING VD LS VWE XQEGM Y KS A? KRLTATT I 

FLA VS RL E KQMWEAVKDEL N 7 L L KE NGVD LS VVVE XQEGM Y KS A? KRLT AT T E 



CI KLEIGWKAWGK5 1 L FAPELA^NT Fv"v*DG?ETKEC ?TQN\RAwNS LIVE DFG 

FLA KLE I GWKAWGKS I L FA? E LANNT FVVDG PET XEC PTQNRAWNS LE VED FG 



CI FGLTSTRMFLKVRESNTTECDSKIIGTAVKNNIJlIHSDLSYvvIESRLNDT 
FLA FG LTS TRMFLKVRES N7TEC DS KI I GT A. VXNNIA I H S DLS YW I E S RL N D 7 



CI W?CE RA VLGE VXSC7 W ? E T H T LWG DG I L E S DL 1 1 ?VT LAG PRS NH NRR ?G 

FLA WKLE RA VLGE VK5 CT W ?E 7 K 7 L WG DG I LE S DL 1 1 ? VTLAG ? RS NH N RR?G 



CI YKTQNQG?WDEGRVEIDFDYC?GTTVTLSE5CG.-:RG?ATRTTTE5GKLIT 
TLA YKTC-N^G?WCEGRVZIDFDYC?GT7V?LSESCGHRGPATR7TTFSGKLIT 



MS 2 A 

CI DWCCRSC7L ? ? L R YQT D5 GC W YGME I RPQRH 0 E KTL VQSQVHA YNADMI D 

FLA DWCCRSCTL? r LR YQTDSGCW Y GME I RPQRHDEKTLVQSQVNA YNADMI D 



CI ? FQLGLLW FLATQE VLRKRWTA.KI S PA.IL I A.L L VL VFGGI T Y7 DVLRY 

FLA PFQLGLL WFL 2 .7QE VLRKRW7A.XI SK?AI L I ALL V" L VFGGI7 YTDVLR Y 



ci vilvgaafa^snsggdvvhlalmatfkiq?vfmvasfl:<arwtnqenill 

FLA VI LVGAAFAFSNSGGOWHLALMA? FKIQPVFMVAS FLXARWTNQEN'ILL 



CI MLAA V F FQMA YK DARQ I L L ft E I ? D VLN 3 LA VAWM I L RA I T FT T T S ? 

FLA MLAA V FFQMA Y H DARQ I L L WE I ? D VL NS LA. VAWM I LRA I T FT 7 7 S NWV ? 



CI LLALL7PRLRCLMLDVYRI LLLMVGIG3L I REKRSAAAKXKGASLLCLAL 

FLA LLALL7 PGLRCLNLDVYR I LLLMVG 1GSLZZZ KRSAAAXKKGAS L LCLAL 



MS 23 

CI AS TG L FN ?M I LAAG L I AC D ? NRKRGW ? AT E VM7A VGLM FA. I VGG LAE L 0 1 

FLA AS TG L FN ?M I LAAGL I AC DPliRKRGWPATF VMTA VG LM FA I VGGLAELD I 



CI D5ft a .I PMT I AGLMFAAFVI 5GX57 DMWI ER7A.DI SWES CAE I 7G3 S ER VD 

FLA D5MAI PM7 1 AGLMF.--AFVISGXSTDMWI ERTADI S a E SDAE I TGSSZKVO 



CI VRLDDGENFQLMNDPG A PWKIWMLRMVCL A I SAYTPWA I L PS VVGFWITL 

FIGURE IB 
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CI 
FLA 



CI 
FLA 



CI 
"LA 



CI 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



CI 
FLA 



VRLDDOGNFQLMNDPGA?WKIWMLRMVCLAISAyT?WAIL?SVVGrwiTL 



Q y? KaGG VLW D 7 ? S ? KL V K KG D T T T G VY ?. I m x L LG 5 V Q - G ^ G VMV r G V 
Q Y7 XRGG VLK37 ? S ? X£ Y XXG 07 7 7G VYR IM7 RG L LG S YQAGAG VM V£G V 



FK7L 77XGAAXM3GFGRL D r YWGS VKE DRLC YSG ?w KLQ- "<V;N : GQ"7 
f ♦ C^!fl?y3 "^^^^ ~ ~* ' ^'"^*S VXE D?.LC ": GG PWXLQKXWSGQDE V 



CM I WE ?G XN VXNVQTXPG V FK7 ? £ G E I GA VT L D F ? TGT SG S ? I VDKNG D 
QMIWr?GXNVXWQ7X?GVFXT?£GEIGAVTLDFPTGTSGS?iyo:-02GD 



VIGL YGNGVIMPNGS YI SA I VQGS RMDE PI ?AG FE ?EM ? V<KQ-VL~ - 
VIGL VGN'GVIM?NG5y i x vQQr^^r p - PAGFE PEMLRXKQI 7 VLDLK 



?GAGX?RRIL?Qi:XEAINR?.iR7AV^^^ 

PGAGXTRRI L ?Q 1 1 XEA I NRRL R T A VLA ?? R VVAAEMAEAL RG L ? I RY£7 



$AV?R£KNGN£IV2WC>LA?LT 

SAVP RSKNGJf EI VDVMCHATLTHHLMS ?HRV?N YNL FVMDEAHr TDPA5 I 



AA.RG Y I $ TXVS1GSAAAI FM7 A7 ? PGTS D ? FPE5N5 P 1 5 DLQT- " - n RAW 
A.ARGYIS7XV£LGI.A.^AIFM7A7??G7SD?F?£SN-5rISDLQ7£I?0R.AW . 



NSGY£WI7EY7GX7V»\rv?S7KMG^ 
N"3G:EWI7£Y7GXT™rv?SVXMGNiIA^^ 



?KCXNDDW , DrvI7TDISEMGA.N?XASRyi^SRX5VX?Tri?£G£GRVILG 
PKCKNDWDrviTTDZSSMGANT^ 



£ PSAVTAASAAQRRGRIGP.NPSQVGDE YC YGGK7NE DDSNFAKftP" a R -m 
£ PS A V7AASAAQRRG RIG RN ? 5Q VG DE YC VGGH7NE DDSN FAK5f7EAR I M 



PDN I MM? N*G L I AQ F YQ? £ r.EXV YTMEGE YRL RG E ERXN FL £ L LR7A? r =>V 
^DN i NMPNG L I AOFYQPE R£ XV Y 7MDGE YRL *G EE = XNFLELLP.7A2L F V 



NS3 





CI 



I G X I G LGG A V LG V A7 F FCWMAE V ?G 7 X I AGML L L S L L LM I VL I ? E ? E KQ R 
FIGURE 1C 
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IGKIGLGGAVLGVA7FFCWMA£V?G7XIAGMLLLSLLLMIVLI?E?EXQR 

N54B 

S QT ONQ LA VfL I C VMT L VS A VAAN EMGWL 0 X7 XS DISS L5*GOR I Z VKZ N F 
S v T DNQLA V ~L I C VM7 L VS A VAAN EMGW1 DX7XS D I S S L FGQR I £ VK£!N r 



SMG £ TZ-L DLR PAT Aw S 1 Y A V-7 7 A VL 7 ? LL XKi 1 7 S D Y Z N7S LTS I N VQAS 
SMGE FLL DLR? A7 AwS L YA VT 7A.VL 7 ? LLKK L Z 7 S D Y I N7S 17 S Z N VQAS 



ALF7LA.RGF? FVDVGVSAi LLAAGCWGQV'7 L T V7 VTAATiL rCH YA YMV? 
Ai r 7LARG F? FV DVG VS ALL LAAGCWGQ V7 L 7 V7V7AA7 LL PC K YA YMV? 



6WQA£AMRSAQRjt7AAG:MKNAVV0GI VA7DV?£i£S77?I*QKXVGQlM 
GWQASP LMRSAQRR7AAG ZMXNAWDG I VAT D V?£LZ."7?IMCKKVGQIM 



L I LVS LAAVWN ?S VX7 VR£AG Z L I TAAAV7LW ENGASS VWNATTAI GLC 
L I LVS LAAWVN =S VX7VREAG ZL1 TAAAV7Z.WENGAS S VWNA77AI GLC 

N55 

HIHKGGWLSC15 Z 75C7L I XNM£X?G1 XRGGAXGR7 1G E VWXZRLNQtf? X£ 
KZMRGGwL3ClSZ7W7LIXttMEK?GL:<RGGA 



£r?R:RXiAIZ£VDRSAJC<HAJlXIGNV7GC-H 

E F7R YRXEAI I E VDRSAAXKARXEG NVTGGH ?VS RG TAXLRW L VERRFL £ 



? VGXV I DLGCG RGGW C Y YMA7QK?. VQE VRG Y7KGG ?GH££ ?QL VQS YGWN 
? VGKVI CLGCGRGGWC Y : MA7QKRVQ£ V?.G Y7XGG ?G H ££ ?QL VQS YGWN 



ZVTMKSGVDVFYR?S£CCD7LLCDZG£SSSSA£V££H?TZRVL£W£DWL 
ZV7MXSGVDVr:^?S£CCD71LC3IG£SSSSAJ:V££K=TZRVL£^/£DwL 



HRG PRE FCVSVLC? YM ? XVI £ XME 1LQRR YGGG1 VRN PLSRNS 7HEK YWV 
HRG?R££C v XVLC? YMPXVZ £XM£ LLQRR : GGG1 VRN ?1S RN5 7KEH YWV 



S?wASGNl/Vr:Sv^M7SQv^LGR^£XRTWXG?QY££DVNL 
SR.ASGN'VVHSVN\v7SQV:LGRw£XR7WKG?0Y££DVNLGSG7R.AVGXrLL 



NS37SXZNN\*IERLRREYSS7WKKDEN^ 

^SD7SXIXIiR:ERLRR£yS37WHX3£NHPYR7^;YHGSYDvXP7GSASSL 



TOGVVaLLSKPKSTITSV?^^ 

VNGVVRLLSK?W-:7:7>:V77MAM7D77?rGCQRVrKEXVD?KA?£??£3V 



K YVLNE77NWL WAFLAREXP. ? RMC3 RE £ PI RXVMS NAALGA>* FEEGNQWR 
XY VLNE77NW1WAFLAREXRPRMCSP.EE FZ RKVNSNAALGAT4 TZZQKQnZ 



SA.REA V£ D ?K FW£MVO £ £ REAH LRGEC.H 7C I Y NMMG XR£ XX?G £ f GXAXG 
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S ARSAVS D ? KFWEMVD EE 3 EAK L RG ECH 7C I Y NMMG KR E KK?G £ rG KAKG 



S RAI WFMWLGARFLE FEA1G FLN T E DHWLGRKNSGGGVEGLGLQK1G Y I LR 
S RAI WFMWLGARF-Z FEALG FLN'EDKWLGRKNSGGG VEGLG^QKLG Y I LR 



E VGT R ?GG K I YADD7 AGWD7 RI ? RADLEN E AXVLE L L DG E H RRLARA HE 
EVGTRPGGKI YADD7AGWD7RI TRADLENEAKVLELLDGEKRRLARAI I E 



LT YRKKW5CVMRPAADGRTVMDVI SRE DQRGSGQ W7 YALN7 F7NLAVQL 
L 7 YRHXWKVMR?AAOGR?VMOV I S RE DQRGSGQ WT YALNT F7N LAVQL 



VRMME G E G V I G ? D D VEKI 7 KG KG r KV* 7 W L FE NG E E RL 3 RMA V5 G DDC W 
VRMMEG EG V I G ? D D VE Kl T KG KG ? KVR7 WL FE NG ZZRLS RMA VS G D DC W 



x? l dd rfa7 s lh flnams kvrkd i qe w k?s 7gw y dwqqv ? fc s n h f7 el i 
k?lddrfatslhfln^s:-^?j<d:qewk?$?gwydwqqv?fcsn>:fteli 



MKDGR7L WPCRGCDEL VGRARI £ PGAGWNVRDTACLAKS YAQMWLLL Y F 
MKDG R? L W ?C RGC DE L VG RAR 1 5 PGA.G WN"V RD7 ACLAK5 YAQMWLLL Y F 



HRS^R^XAICSAV 

HRRDLRLMANA:CSAV?VNWV?TGR77WS1HAGGEWM77EDMLEVWNRVV 




NQVRAI I GDEKYVD YM5 S LKRYE D77L VE C7VL 
NQ VRAI I G DEXYVD YMS S LXRY E D77L VE D7VL 



FIGURE IE 




1 2 3 4 5 6 7 8 9 10 11 12 13 
jour post-inoculation 

FIGURE 2 

0 (3 souris/temps) 

3 »'] 
I „•] 




seuil de detection 



jour post-inoculation 
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Souris 

Lignees consanguines de laboratoire : 



Souris sauvages : 



BALB/c, C57BL/6, DDK, 129, C3H et DBA/1 
sensibles a 1'infection par le virus WN 



SEG/Pas (Mus spretus), MAI/Pas, MBT/Pas (Mus m. musculus) 
-> resistantes a 1'infection par le virus WN 

Generation de souris de premier croisement en retour (BC1) 



Parents 



cfMAI/Pas ?C57BL/6 
X 

o" MBT/Pas ° BALB/c 



Fl 



BC1 



r 



I 

cf'Fl 
L_ 



¥C57BL'6 
° BALB/c 



1 



a)BCI b)BCl c)BCl d) BC1 
(C57BU6 (C57BL/6 (BALB/c (BALB/c 



x 

MAI) 



MBT) 



x 

MAI) 



x 

MBT) 



Virus 

Injection du virus West Nile (WN) 
Souris agees de 5 semaines 

Observation des souris pendant les 14 jours suivant 1'infection 
Genotypage des alleles Flv 

marqueurs flanquant le locus Flv sur le chromosome 5 de la souris 



FIGURE 6 
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Parents de la generation de premier croisement en retour (BC1) 



No-3 No.107 No.27 No.l£4 No.222 No.244 iVo.146 NoJl 
Chr5desouris f <? <? 2. J <? J J 




D5MU321 
D5Mit247 



Pheaotype; R 


"R 


R 


R 


S 


R 


R 


R 
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pcT/nW!ii68 



Phenotype 
Flv* 


Survivants 


Morts 


Total 


Resistant 
(F/vVF/v*) 


108 


0 


108 (55%) 


Sensible 
{FW/FIV) 


21 


74 


95 (45%) 


Total 


129 (66%) 


74 (34%) 


203 



* un allele Fhf est sufBsant pour conferer la resistance 



Figure 10 
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LISTE DE SEQUENCES 

<110> INSTITUT PASTEUR 

KIMRON VETERINARY INSTITUTE 

DESPRES Philippe 

DEUBEL Vincent 

GUENET Jean-Louis 

DROUET Marie-Therese 

MALKINSON Mertyn 

BANET Caroline 

FRENKIEL Marie-Pascale 

COURAGEOT Marie-Pierre 

COULILABY Fasseli 

CATTEAU Adeline 

FLAMAND Marie 

WEBER Patrick 

CECCALDI Pierre-Emmanuel 

<120> SOUCHE NEUROVIRULENTE DU VIRUS WEST NILE ET SES 
APPLICATIONS 

<130> 226CAS93EXT 

<140> 
<141> 

<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 

<211> 11029 

<212> ARN 

<213> Flavivirus sp. 

<220> 
<221> CDS 

<222> (97) . . (10395) 
<400> 1 

agtagttcgc ctgtgtgagc tgacaaactt agtagtgttt gtgaggatta acaacaatta 60 

acacagtgcg agctgtttct tagcacgaag atctcg atg tct aag aaa cca gga 114 

Met Ser Lys Lys Pro Gly 
1 5 

ggg ccc ggc aag age egg get gtc aat atg eta aaa cgc gga atg ccc 162 
Gly Pro Gly Lys Ser Arg Ala Val Asn Met Leu Lys Arg Gly Met Pro 
10 15 20 

cgc gtg ttg tec ttg att gga ctg aag agg get atg ttg age ctg ate 210 
Arg Val Leu Ser Leu lie Gly Leu Lys Arg Ala Met Leu Ser Leu He 
25 30 35 

gac ggc aag ggg cca ata cga ttt gtg ttg get etc ttg gcg ttc ttc 258 
Asp Gly Lys Gly Pro He Arg Phe Val Leu Ala Leu Leu Ala Phe Phe 
40 45 50 

agg ttc aca gca att get ccg ace cga gca gtg ctg gat cga tgg aga 306 
Arg Phe Thr Ala He Ala Pro Thr Arg Ala Val Leu Asp Arg Trp Arg 
55 60 65 70 
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ggt gtg aat aaa caa aca gcg atg aaa cac ctt ctg agt ttt aag aag 354 
Gly Val Asn Lys Gin Thr Ala Met Lys His Leu Leu Ser Phe Lys Lys 
75 80 85 

gaa eta ggg acc ttg acc agt get ate aat egg egg age tea aaa caa 402 
Glu Leu Gly Thr Leu Thr Ser Ala lie Asn Arg Arg Ser Ser Lys Gin 
90 95 100 

aag aaa aga gga gga aag acc gga att gca gtc atg att ggc ctg ate 450 
Lys Lys Arg Gly Gly Lys Thr Gly He Ala Val Met He Gly Leu He 
105 110 115 

gee age gta gga gca gtc acc etc tct aac ttc caa ggg aag gtg atg 498 
Ala Ser Val Gly Ala Val Thr Leu Ser Asn Phe Gin Gly Lys Val Met 
120 125 130 

atg acg gta aat get act gac gtc aca gat gtc ate acg att cca aca 546 
Met Thr Val Asn Ala Thr Asp Val Thr Asp Val He Thr He Pro Thr 
135 140 145 150 

get get gga aag aac eta tgc att gtc aga gca atg gat gtg gga tac 594 
Ala Ala Gly Lys Asn Leu Cys He Val Arg Ala Met Asp Val Gly Tyr 
155 160 165 

atg tgc gat gat act ate act tat gaa tgc cca gtg ctg teg get ggt 642 
Met Cys Asp Asp Thr He Thr Tyr Glu Cys Pro Val Leu Ser Ala Gly 
170 175 180 

aat gat cca gaa gac ate gac tgt tgg tgc aca aag tea gca gtc tac 690 
Asn Asp Pro Glu Asp He Asp Cys Trp Cys Thr Lys Ser Ala Val Tyr 
185 190 195 

gtc agg tat gga aga tgc acc aag aca cgc cac tea aga cgc agt egg 738 
Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg His Ser Arg Arg Ser Arg 
200 " 205 210 

agg tea ctg aca gtg cag aca cac gga gaa age act eta gcg aac aag 786 
Arg Ser Leu Thr Val Gin Thr His Gly Glu Ser Thr Leu Ala Asn' Lys 
215 220 225 230 

aag ggg get tgg atg gac age acc aag gee aca agg tat ttg gta aaa 834 
Lys Gly Ala Trp Met Asp Ser Thr Lys Ala Thr Arg Tyr Leu Val Lys 
235 240 245 

aca gaa tea tgg ate ttg agg aac cct gga tat gee ctg gtg gca gee 882 
Thr Glu Ser Trp He Leu Arg Asn Pro Gly Tyr Ala Leu Val Ala Ala 
250 255 " 260 

gtc att ggt tgg atg ctt ggg age aac acc atg cag aga gtt gtg ttt 930 
Val He Gly. Trp Met Leu Gly Ser Asn Thr Met Gin Arg Val Val Phe 
265 270 275 

gtc gtg eta ttg ctt ttg gtg gee cca get tac age ttt aac tgc ctt 978 
Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu 
280 285 290 

gga atg age aac aga gac ttc ttg gaa gga gtg tct gga gca aca tgg 1026 
Gly Met Ser Asn Arg Asp Phe Leu Glu Gly Val Ser Gly Ala Thr Trp 
295 300 305 310 
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gtg gat ttg get etc gaa ggc gac age tgc gtg act ate atg tct aag 1074 
Val Asp Leu Val Leu Glu Gly Asp Ser Cys Vai Thr lie Met Ser Lys 
315 320 325 

gac aag cct ace ate gat gtg aag atg atg aat atg gag gcg gee aac 1122 
Asp Lys Pro Thr He Asp Val Lys Met Met Asn Met Glu Ala Ala Asn 
330 335 340 

ctg gca gag gtc cgc agt tat tgc tat ttg get ace gtc age gat etc 1170 
Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala Thr Val Ser Asp Leu 
345 350 355 

tec acc aaa get gcg tgc ccg acc atg gga gaa get cac aat gac aaa 1218 
Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu Ala His Asn Asp Lys 
360 365 370 

cgt get gac cca get ttt gtg tgc aga caa gga gtg gtg gac agg ggc 1266 
Arg Ala Asp Pro Ala Phe Val Cys Arg Gin Gly Val Val Asp Arg Gly 
375 380 385 390 

tgg ggc aac ggc tgc gga eta ttt ggc aaa gga age att gac aca tgc 1314 
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser He Asp Thr Cys 
395 400 405 

gee aaa ttt gee tgc tct acc aag gca ata gga aga acc ate ttg aaa 1362 
Ala Lys Phe Ala Cys Ser Thr Lys Ala He Gly Arg Thr He Leu Lys 
410 415 420 

gag aat ate aag tac gaa gtg gee att ttt gtc cat gga cca act act 1410 
Glu Asn He Lys Tyr Glu Val Ala He Phe Val His Gly Pro Thr Thr 
425 430 435 

gtg gag teg cac gga aac tac tec aca cag gtt gga gee act cag gca 1458 
Val Glu Ser His Gly Asn Tyr Ser Thr Gin Val Gly Ala Thr Gin Ala 
440 445 450 

ggg aga ttc age ate act cct gcg gcg cct tea tac aca cca aag ctt 1506 
Gly Arg Phe Ser He Thr Pro Ala Ala Pro Ser Tyr Thr Leu Lys Leu 
455 " 460 465 470 

gga gaa tat gga gag gtg aca gtg gac tgt gaa cca egg tea ggg att 1554 
Gly Glu Tyr Gly Glu Val Thr Val Asp Cys Glu Pro Arg Ser Gly He 
475 480 485 

gac acc aat gca tac tac gtg atg act gtt gga aca aag acg ttc ttg 1602 
Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly Thr Lys Thr Phe Leu 
490 495 500 

gtc cat cgt gag tgg ttc atg gac etc aac etc cct tgg age agt get 1650 
Val His Arg Glu Trp Phe Met Asp Leu Asn Leu Pro Trp Ser Ser Ala 
505 510 515 

gga agt act gtg tgg agg aac aga gag acg tta atg gag ttt gag gaa 1698 
Glv Ser Thr Val Trp Arg Asn Arg Glu Thr Leu Met Glu Phe Glu Glu 
520 525 530 

cca cac gee acg aag cag tct gtg ata gca ttg ggc tea caa gag gga 1746 
Pro His Ala Thr Lys Gin Ser Val He Ala Leu Gly Ser Gin Glu Gly 
535 540 545 550 



WO 02/081511 PCT/«Proil68 

4/29 

get ctg cat caa get ttg get gga gee ate ect gtg gaa ttt tea age 1794 
Ala Leu His Gin Ala Leu Ala Gly Ala He Pro Val Glu Phe Ser Ser 
555 560 565 

aac act gtc aag ttg acg teg ggt cat ttg aag cgt aga gtg aag atg 1842 
Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Val Lys Met 
570 575 580 

gaa aaa ttg cag ttg aag gga aca acc tat ggc-gtc tgt tea aag get 1890 
Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr Gly Val Cys Ser Lys Ala 
585 590 595 

ttc aag ttt ctt ggg act ccc gca gac aca ggt cac ggc act gtg gtg 1938 
Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly His Gly Thr Val Val 
600 605 610 

ttg gaa ttg cag tac act ggc acg gat gga cct tgc aaa gtt ect ate 1986 
Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro He 
615 620 625 630 

teg tea gtg get tea ttg aac gac eta acg cca gtg ggc aga ttg gtc 2034 
Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val 
635 640 645 

act gtc aac cct ttt gtt tea gtg gec acg gee aac get aag gtc ctg 2082 
Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala Asn Ala Lys Val Leu 
650 655 660 

att gaa ttg gaa cca ccc ttt gga gac tea tac ata gtg gtg ggc aga 2130 
He Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr He Val Val Gly Arg 
665 670 675 

gga gaa caa cag att aat cac cat tgg cac aag tct gga age age att 2178 
Gly Glu Gin Gin He Asn His His Trp His Lys Ser Gly Ser Ser He 
680 685 690 

ggc aaa gee ttt aca acc acc etc aaa gga gcg cag aga eta gee get 2226 
Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly Ala Gin Arg Leu Ala Ala 
695 700 705 710 

eta gga gac aca get tgg gac ttt gga tea gtt gga ggg gtg ttc acc 2274 
Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Val Phe Thr 
715 720 725 

tea gtt ggg aag get gtc cat caa gtg ttc gga gga gca ttc cgc tea 2322 
Ser Val Gly Lys Ala Val His Gin Val Phe Gly Gly Ala Phe Arg Ser 
730 735 740 

ctg ttc gga ggc atg tec tgg ata acg caa gga ttg ctg ggg get etc 2370 
Leu Phe Gly Gly Met Ser Trp He Thr Gin Gly Leu Leu Gly Ala Leu 
745 750 755 

ctg ttg tgg atg ggc ate aat get cgt gat agg tec ata get etc acg 2418 
Leu Leu Trp Met Gly He Asn Ala Arg Asp Arg Ser He Ala Leu Thr 
760 765 770 

ttt etc gca gtt gga gga gtt ctg etc ttc etc tec gtg aac gtg cac 2466 
Phe Leu Ala Val Gly Gly Val Leu Leu Phe Leu Ser Val Asn Val His 
775 780 785 790 
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get gac act ggg tgt gec ata gac ate age egg caa gag ctg aga tgt 2514 
Ala Asp Thr Gly Cys Ala lie Asp lie Ser Arg Gin Glu Leu Arg Cys 
795 800 805 

gga aat gga gtg etc ata cac aat gat gtg gag get tgg atg gac egg 2562 
Gly Asn Gly Val Phe lie His Asn Asp Val Glu Ala Trp Met Asp Arg 
810 815 820 

tac aag tat tac cct caa acg cca caa ggc eta gee aag ate azz cag 2610 
Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly Leu Ala Lys lie lie Gin 
825 v 830 835 

aaa get cat aag gaa gga gtg tgc ggt eta cga tea gtt tec aga ctg 2658 
Lys Ala His Lys Glu Gly Val Cys Gly Leu Arg Ser Val Ser Arg Leu 
840 845 850 

gag cat caa atg tgg gaa gca gtg aag gac gag ctg aac act ctt ttg 2706 
Glu His Gin Met Trp Glu Ala Val Lys Asp Glu Leu Asn Thr Leu Leu 
855 860 865 870 

aag gag aat ggt gtg gac ctt agt gtc gtg gtt gag aaa cag gag gga 2754 
Lys Glu Asn Gly Val Asp Leu Ser Val Val Val Glu Lys Gin Glu Gly 
875 880 885 

atg tac aag tea gca cct aaa cgc etc ace gec acc acg gaa aaa ttg 2802 
Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr Ala Thr Thr Glu Lys Leu 
890 895 900 

gaa att ggc tgg aag gee tgg gga aag agt att tta ttt gca cca gaa 2850 
Glu lie Gly Trp Lys Ala Trp Gly Lys Ser lie Leu Phe Ala Pro Glu 
905 910 915 

etc gee aac aac acc ttt gtg gtt gat ggt ccg gag acc aag gaa tgt 2898 
Leu Ala Asn Asn Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys 
920 925 930 

ccg act cag aat cgc get tgg aat age tta gaa gtg gag gat ttt gga 2946 
Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu Glu Val Glu Asp Phe Gly 
935 940 945 950 

ttt ggt etc acc age act egg atg ttc ctg aag gtc aga gag age aac 2994 
Phe Gly Leu Thr Ser Thr Arg Met Phe Leu Lys Val Arg Glu Ser Asn 
955 960 965 

aca act gaa tgt gac teg aag ate att gga acg get gtc aag aac aac 3042 
Thr Thr Glu Cys Asp Ser Lys lie lie Gly Thr Ala Val Lys Asn Asn 
970 975 980 

ttg gcg ate cac agt gac ctg tec tat tgg att gaa age agg etc aat 3090 
Leu Ala lie His Ser Asp Leu Ser Tyr Trp lie Glu Ser Arg Leu Asn 
985 990 995 

gat acg tgg aag ctt gaa agg gca gtt ctg ggt gaa gtc aaa tea tgt 3138 
Asp Thr Trp Lys Leu Glu Arg Ala Val Leu Gly Glu Val Lys Ser Cys 
1000 1005 * 1010 

acg tgg cct gag acg cat acc ttg tgg ggc gat gga ate ctt gag agt 3186 
Thr Trp Pro Glu Thr His Thr Leu Trp Gly Asp Gly lie Leu Glu Ser 
1015 1020 1025 1030 
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gac ttg ata ata cca gtc aca ctg gcg gga cca cga age aat cac aat 3234 
Asp Leu lie He Pro Val Thr Leu Ala Gly Pro Arg Ser Asn His Asn 
1035 1040 1045 

egg aga cct ggg tac aag aca caa aac cag ggc cca tgg gac gaa ggc 3282 
Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin Gly Pro Trp Asp Glu Gly 
1050 1055 1060 

egg gta gag att gac ztc gat tac tgc cca gga act acg gee acc ctg 3330 
Arg Val Glu He Asp Phe Asp Tyr Cys Pro Gly Thr Thr Val Thr Leu 
1065 1070 1075 

agt gag age tgc gga cac cat gga cct gee act cgc acc acc aca gag 3378 
Ser Glu Ser Cys Gly His Arg Gly Pro Ala Thr Arg Thr Thr Thr Glu 
1080 1085 1090 

age gga aag ttg ata aca gat tgg tgc tgc agg age tgc acc tta cca 3426 
Ser Gly Lys Leu He Thr Asp Trp Cys Cys Arg Ser Cys Thr Leu Pro 
1095 ' 1100 1105 1110 

cca ctg cgc tac caa act gac age ggc tgt tgg tat ggt atg gag ate 3474 
Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys Trp Tyr Gly Met Glu He 
1115 1120 1125 

aga cca cag aga cat gat gaa aag acc etc gtg cag tea caa gtg aat 3522 
Arg Pro Gin Arg His Asp Glu Lys Thr Leu Val Gin Ser Gin Val Asn 
1130 1135 1140 

get tat aat get gat atg att gac cct ttt cag ttg ggc ctt ctg gtc 3570 
Ala Tyr Asn Ala Asp Met lie Asp Pro Phe Gin Leu Gly Leu Leu Val 
1145 1150 1155 

gtg ttc ttg gee acc cag gag gtc ctt cgc aag agg tgg aca gee aag 3618 
Val Phe Leu Ala Thr Gin Giu Val Leu Arg Lys Arg Trp Thr Ala Lys 
1160 1165 1170 

ate age atg cca get ata ctg att get ctg eta gtc ctg gtg ttt ggg- 3666 
He Ser Met Pro Ala He Leu He Ala Leu Leu Val Leu Val Phe Gly 
1175 1180 1185 1190 

ggc att act tac act gat gtg tta cgc tat gtc ate ttg gtg ggg gca 3714 
Gly He Thr Tyr Thr Asp Val Leu Arg Tyr Val He Leu Val Gly Ala 
1195 1200 1205 

get ttc gca gaa tct aat teg gga gga gac gtg gta cac ttg gcg etc 3762 
Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp Val Val His Leu Ala Leu 
1210 1215 1220 

atg gcg acc ttc aag ata caa cca gtg ttt atg gtg gca teg ttt etc 3810 
Met Ala Thr Phe Lys He Gin Pro Val Phe Met Val Ala Ser Phe Leu 
1225 1230 1235 

aaa gcg aga tgg acc aac cag gag aac att ttg ttg atg ttg gcg get 3858 
Lys Ala Arg Trp Thr Asn Gin Glu Asn He Leu Leu Met Leu Ala Ala 
1240 1245 1250 

gtt ttc ttt caa atg get tat cac gat gee cgc caa att ctg etc tgg 3906 
Val Phe Phe Gin Met Ala Tyr His Asp Ala Arg Gin He Leu Leu Trp 
1255 1260 1265 1270 



WO 02/081511 PCT/F^^ 

7/29 

gag ate cct gat gtg ttg aat tea ctg gcg gca get tgg atg ata ctg 3954 
Glu lie Pro Asp Val Leu Asn Ser Leu Ala Val Ala Trp Met lie Leu 
1275 1280 1285 



aga gee ata aca ttc aca acg aca tea aat gtg gtc gtc ccg ctg eta 4002 
Arg Ala lie Thr Phe Thr Thr Thr Ser Asn Val Val Val Pro Leu Leu 
1290 1295 1300 

gec ctg eta aca ccc egg ctg aga tgc ttg aat ctg gat gtg tac agg 4050 
Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu Asn Leu Asp Val Tyr Arg 
1305 1310 1315 

ata ctg ctg ttg atg gtc gga ata ggc age ttg ate agg gag aag agg 4098 
He Leu Leu Leu Met Val Gly He Gly Ser Leu He Arg Glu Lys Arg 
1320 1325 1330 

agt gca get gca aaa aag aaa gga gca agt ctg eta tgc ttg get eta 414 6 
Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser Leu Leu Cys Leu Ala Leu 
1335 1340 1345 1350 

gec tea aca gga ctt ttc aac ccc atg ate ctt get get gga ctg att 4194 
Ala Ser Thr Gly Leu Phe Asn Pro Met He Leu Ala Ala Gly Leu He 
1355 1360 .1365 

gca tgt gat ccc aac cgt aaa cgc gga tgg ccc gca act gaa gtg atg 4242 
Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp Pro Ala Thr Glu Val Met 
1370 1375 1380 

aca get gtc ggc eta atg ttt gec ate gtc gga ggg ctg gca gag ctt 4290 
Thr Ala Val Gly Leu Met Phe Ala He Val Gly Gly Leu Ala Glu Leu 
1385 1390 1395 

gac att gac tec atg gec att cca atg act ate gcg ggg etc atg ttt 4338 
Asp He Asp Ser Met Ala He Pro Met Thr He Ala Gly Leu Met Phe 
1400 1405 1410 

get get ttc gtg att tct ggg aaa tea aca gat atg tgg att gag aga 4386 
Ala Ala Phe Val He Ser Gly Lys Ser Thr Asp Met Trp He Glu Arg 
1415 1420 1425 1430 

acg gcg gac att tec tgg gaa agt gat gca gaa att aca ggc teg age 4434 
Thr Ala Asp He Ser Trp Glu Ser Asp Ala Glu He Thr Gly Ser Ser 
1435 1440 1445 

gaa aga gtt gat gtt egg ctt gat gat ggt gaa aac ttc cag etc atg 4482 
Glu Arg Val Asp Val Arg Leu Asp Asp Gly Glu Asn Phe Gin Leu Met 
1450 1455 1460 

aat gat cca gga gca cct tgg aag ata tgg atg etc aga atg gtc tgt 4530 
Asn Asp Pro Gly Ala Pro Trp Lys He Trp Met Leu Arg Met Val Cys 
1465 1470 1475 

etc gcg att agt gcg tac ace ccc tgg gca ate ttg ccc tea gta gtt 4578 
Leu Ala He Ser Ala Tyr Thr Pro Trp Ala He Leu Pro Ser Val Val 
1480 1485 1490 

gga ttt tgg ata act etc caa tac aca aag aga gga ggt gtg ttg tgg 4626 
Gly Phe Trp He Thr Leu Gin Tyr Thr Lys Arg Gly Gly Val Leu Trp 
1495 1500 1505 1510 
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gac act ccc tea cca asg gag tac aaa aag ggg gac acg acc acc ggc 4674 
Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly 
1515 1520 1525 

gtc tac agg ate atg act cgt ggg ctg etc ggc agt tat caa gca gga 4722 
Val Tyr Arg He Met Thr Arg Gly Leu Leu Gly Ser Tyr Gin Ala Gly 
1530 1535 1540 

gcg ggc gtg atg gtt gaa ggt get ttc cac accctt tgg cat aca aca 4770 
Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr 
1545 1550 1555 

aaa gga gee get ttg atg age gga gag ggc cgc ctg gac cca tac tgg 4818 
Lys Giy Ala Ala Leu Met Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 
1560 1565 1570 

ggc agt gtc aag gag gat cga ctt tgt tac gga gga ccc tgg aaa ttg 4866 
Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu 
1575 1580 ' 1585 1590 

cag cac aag tgg aac ggg cag gat gag gtg cag atg att gtg gtg gaa 4914 
Gin His Lys Trp Asn Gly Gin Asp Glu Val Gin Met He Val Val Glu 
1595 1600 1605 

cct ggc aag aac gtt aag aac gtc cag acg aaa cca ggg gtg ttc aaa 4962 
Pro Gly Lys Asn Val Lys Asn Val Gin Thr Lys Pro Gly Val Phe Lys 
1610 1615 1620 

aca cct gaa gga gaa ate ggg gee gtg act ttg gac ttc ccc act gga 5010 
Thr Pro Glu Gly Glu He Gly Ala Val Thr Leu Asp Phe Pro Thr Gly 
1625 . 1630 1635 

aca tea ggc tea cca ata gtg gac aaa aac ggt gat gtg att ggg ctt 5058 
Thr Ser Gly Ser Pro lie Val Asp Lys Asn Gly Asp Val He Gly Leu 
1640 1645 1650 

tat ggc aat gga gtc ata atg ccc aac ggc tea tac ata age; gcg ata 5106 
Tyr Gly Asn Gly Val He Met Pro Asn Gly Ser Tyr He Ser Ala He 
1655 1660 1665 1670 

gtg cag ggt gaa agg atg gat gag cca ate cca gee gga ttc gaa cct 5154 
Val Gin Gly Glu Arg Met Asp Glu Pro lie Pro Ala Gly Phe Glu Pro 
1675 1680 1685 

gag atg ctg agg aaa aaa cag ate act gta ctg gat etc cat ccc ggc 5202 
Glu Met Leu Arg Lys Lys Gin He Thr Val Leu Asp Leu His Pro Gly 
1690 1695 1700 

gec ggt aaa aca agg agg att ctg cca cag ate ate aaa gag gec ata 5250 
Ala Gly Lys Thr Arg Arg He Leu Pro Gin He He Lys Glu Ala He 
1705 1710 1715 

aac aga aga ctg aga aca gec gtg eta gca cca acc agg gtt gtg get 5298 
Asn Arg Arg Leu Arg Thr Ala Val Leu Ala Pro Thr Arg Val Val Ala 
1720 1725 1730 

get gag atg get gaa gca ctg aga gga ctg ccc ate egg tac cag aca 534 6. 
Ala Glu Met Ala Glu Ala Leu Arg Gly Leu Pro He Arg Tyr Gin Thr 
1735 1740 1745 1750 
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tec gca gtg ccc aga gaa cat aat gga aat gag att gtt gat gtc atg 5394 

Ser Ala Val Pro Arg Glu His Asn Gly Asn Glu lie Val Asp Val Met 
1755 1760 1765 

tgt cat get ace etc ace cac agg ccg atg tct cct cac agg gtg ccg 5442 
Cys His Ala Thr Leu Thr His Arg Leu Met Ser Pro His Arg Val Pro 
1770 1775 1780 

aac tac aac ctg ttc gtg atg gat gag get cat .ttc acc gac cca get 5490 
Asn Tyr Asn Leu Phe Val Met Aso Glu Ala His Phe Thr Asp Pro Ala 
1785 1790 1795 

agt ate gca gca aga ggt tac att tec aca aag gtc gag eta ggg gag 5538 
Ser He Ala Ala Arg Gly Tyr lie Ser Thr Lys Val Glu Leu Gly Glu 
1800 1805 1810 

gcg gcg gca ata ttc atg aca gec acc cca cca ggc act tea gat cca 5586 
Ala Ala Ala He Phe Met Thr Ala Thr Pro Pro Gly Thr Ser Asp Pro 
1815 1820 1825 1830 

ttc cca gag tec aat tea cca ant tec gac tta cag act gag ate ccg 5634 
Phe Pro Glu Ser Asn Ser Pro He Ser Asp Leu Gin Thr Glu He Pro 
1835 1840 1845 

gat cga get tgg aac tct gga tac gaa tgg ate aca gaa tac acc ggg 5682 
Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp He Thr Glu Tyr Thr Gly 
1850 1355 1860 

aag acg gtt tgg ttt gtg cct agt gtc aag atg ggg aat gag att gee 5730 
Lys Thr Val Trp Phe Val Pro Ser Val Lys Met Gly Asn Glu He Ala 
1865 1870 1875 

ctt tgc eta caa cgt get gga aag aaa gta gtc caa ttg aac aga aag 5778 
Leu Cys Leu Gin Arg Ala Gly Lys Lys Val Val Gin Leu Asn Arg Lys 
1880 1685 1890 

teg tac gag acg gag tac cca aaa tgt aag aac gat gat tgg gac ttt 5826 
Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys Asn Asp Asp Trp Asp Phe 
1895 1900 1905 1910 

gtt ate aca aca gac ata tct gaa atg ggg get aac ttc aag gcg age 5874 
Val He Thr Thr Asp He Ser Glu Met Gly Ala Asn Phe Lys Ala Ser 
1915 1920 1925 

agg gtg att gac age egg aag agt gtg aaa cca acc ate ata aca gaa 5922 
Arg Val He Asp Ser Arg Lys Ser Val Lys Pro Thr He He Thr Glu 
1930 1935 1940 

gga gaa ggg aga gtg ate ctg gga gaa cca tct gca gtg aca gca get 5970 
Gly Glu Gly Arg Val lie Leu Gly Glu Pro Ser Ala Val Thr Ala Ala 
1945 1950 1955 

agt gee gec cag aga cgt gga cgt ate ggt aga aat ccg teg caa gtt 6018 
Ser Ala Ala Gin Arg Arg Gly Arg He Gly Arg Asn Pro Ser Gin Val 
1960 1965 1970 

ggt gat gag tac tgt tat ggg ggg cac acg aat gaa gac gac teg aac 6066 
Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr Asn Glu Asp Asp Ser Asn 
1975 1930 1985 1990 
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ttc gee cat tgg act gag gca cga ate ate ccg gac aac ate aac atg 6114 
Phe Ala His Trp Thr Glu Ala Arg lie Met Pro Asp Asn lie Asn Met 
1995 2000 2005 

cca aac gga ctg ate get caa ttc tac caa cca gag cgt gag aag gta 6162 
Pro Asn Gly Leu He Ala Gin Phe Tyr Gin Pro Glu Arg Glu Lys Val 
2010 2015 2020 

tat ace atg gag ggg gaa tac egg etc aga gga gaa gag agg aaa aac 6210 
Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg Gly Glu Glu Arg Lys Asn 
2025 2030 2035 

ttt ctg gaa ctg ttg agg act gca gat ctg cca gtt tgg ctg get tac 6258 
Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu Pro Val Trp Leu Ala Tyr 
2040 2045 2050 

aag gtt gca gcg get gga gtg tea tac cac gac egg agg tgg tgc ttt 6306 
Lys Val Ala Ala Ala Gly Val Ser Tyr His Asp Arg Arg Trp Cys Phe 
2055 2060 2065 2070 

gat ggt cct agg aca aac aca att tta gaa gac aac aac gaa gtg gaa 6354 
Asp Gly Pro Arg Thr Asn Thr He Leu Glu Asp Asn Asn Glu Val Glu 
2075 2080 2085 

gtc ate acg aag ctt ggt gaa agg aag att ctg agg ccg cgc tgg att 6402 
Val He Thr Lys Leu Gly Glu Arg Lys He Leu Arg Pro Arg Trp He 
2090 2095 2100 



gac gee agg gtg tac teg gat cac cag gca eta aag gcg ttc aag gac 
Asp Ala Arg Val Tyr Ser Asp His Gin Ala Leu Lys Ala Phe Lys Asp 
2105 2110 2115 



6450 



ttc gee teg gga aaa cgt tct cag ata ggg etc att gag gtt ctg gga 6498 
Phe Ala Ser Gly Lys Arg Ser Gin lie Gly Leu He Glu Val Leu Gly 
2120 " 2125 2130 

aag atg cct gag cac ttc atg ggg aag aca tgg gaa gca ctt gac ace 6546 
Lys Met Pro Glu His Phe Met Gly Lys Thr Trp Glu Ala Leu Asp Thr 
2135 2140 2145 2150 

atg tac gtt gtg gee act gca gag aaa gga gga aga get cac aga atg 6594 
Met Tyr Val Val Ala Thr Ala Glu Lys Gly Gly Arg Ala His Arg Met 
2155 2160 2165 

gec ctg gag gaa ctg cca gat get ctt cag aca att gee ttg att gee 6642 
Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin Thr He Ala Leu He Ala 
2170 2175 2180 

tta ttg agt gtg atg acc atg gga gta ttc ttc etc etc atg cag egg 6690 
Leu Leu Ser Val Met Thr Met Gly Val Phe Phe Leu Leu Met Gin Arg 
2185 2190 2195 

aag ggc att gga aag ata ggt ttg gga ggc get gtc ttg gga gtc gcg 6738 
Lys Gly He Gly Lys He Gly Leu Gly Gly Ala Val Leu Gly Val Ala 
2200 2205 2210 

acc ttt ttc tgt tgg atg get gaa gtt cca gga acg aag ate gee gga 6786 
Thr Phe Phe Cys Trp Met Ala Glu Val Pro Gly Thr Lys He Ala Gly 
2215 2220 2225 2230 
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atg ttg ctg etc tec ctt etc ttg atg att gtg eta att cct gag cca 
Met Leu Leu Leu Ser Leu Leu Leu Met lie Val Leu lie Pro Glu Pro 
2235 2240 2245 



6834 



gag aag caa cgt teg cag aca gac aac cag eta gee gtg ttc ctg att 
Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin Leu Ala Val Phe Leu lie 
2250 . 2255 2260 



6882 



tgt gtc atg acc ctt gtg age gca gtg gca gee aac gag atg ggt tgg 
Cys Val Met Thr Leu Val Ser Ala Val Ala Ala Asn Glu Met Gly Trp 
2265 2270 2275 



6930 



eta gac aag acc aag agt gac ata age agt ttc ttt ggg caa aga att 
Leu Asp Lys Thr Lys Ser Asp lie Ser Ser Leu Phe Gly Gin Arg lie 
2280 2285 2290 



6978 



gag etc aag gag aat ttc age atg gga gag ttt ctt ctg gac ttg agg 
Glu Val Lys Glu Asn Phe Ser Met Gly Glu Phe Leu Leu Asp Leu Arg 
2295 2300 2305 2310 



7026 



ccg gca aca gee tgg tea ctg tac get gtg aca aca gcg gtc etc act 
Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val Thr Thr Ala Val Leu Thr 
2315 2320 2325 



7074 



cca ctg eta aag- cat ttg ate acg tea gat tac ate aac acc tea ttg 
Pro Leu Leu Lys His Leu lie Thr Ser Asp Tyr lie Asn Thr Ser Leu 
2330 2335 2340 



7122 



acc tea ata aac gtt cag gca agt gca eta ttc aca etc gcg cga ggc 
Thr Ser lie Asn Val Gin Ala Ser Ala Leu Phe Thr Leu Ala Arg Gly 
2345 2350 2355 



7170 



ttc ccc ttc gtc gat gtt gga gtg teg get etc ctg eta gca gec gga 
Phe Pro Phe Val Asp Val Gly Val Ser Ala Leu Leu Leu Ala Ala Gly 
2360 2365 2370 



7218 



tgc tgg gga caa gtc acc etc acc gtt acg gta aca gcg gca aca etc 
Cys Trp Gly Gin Val Thr Leu Thr Val Thr Val Thr Ala Ala Thr Leu 
2375 2380 2385 2390 



7266 



ctt ttt tgc cac tat gec tac atg gtt ccc ggt tgg caa get gag gca 
Leu Phe Cys His Tyr Ala Tyr Met Val Pro Gly Trp Gin Ala Glu Ala 
2395 2400 2405 



7314 



atg cgc tea gec cag egg egg aca gcg gec gga ate atg aaa aac get 
Met Arg Ser Ala Gin Arg Arg Thr Ala Ala Gly lie Met Lys Asn Ala 
2410 2415 2420 



7362 



gta gtg gat ggc ate gtg gee acg gac gtc cca gaa tta gag cgc acc 
Val Val Asp Gly He Val Ala Thr Asp Val Pro Glu Leu Glu Arg Thr 
2425 " 2430 2435 



7410 



aca ccc ate atg cag aag aaa gtt gga cag ate atg ctg ate ttg gtg 
Thr Pro He Met Gin Lys Lys Val Gly Gin He Met Leu He Leu Val 
2440 2445 2450 



7458 



tct eta get gca gta gta gtg aac ccg tct gtg aag aca gta cga gaa 
Ser Leu Ala Ala Val Val Val Asn Pro Ser Val Lys Thr Val Arg Glu 
2455 2460 2465 2470 



7506 



• m 
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gcc gga att ttg ate acg gec gca gcg gtg acg ctt tgg gag aat gga 7554 
Ala Gly lie Leu He Thr Ala Ala Ala Val Thr Leu Trp Glu Asn Gly 
2475 2480 2485 

gca age tct gtc tgg aac gca aca act gcc ate gga etc tgc cac ate 7602 
Ala Ser Ser Val Trp Asn Ala Thr Thr Ala He Gly Leu Cys His He 
2490 2495 2500 

atg cgt ggg ggt tgg ttg tea tgt eta tec ata aca egg aca etc ata 7650 
Met Arg Gly Gly Trp Leu Ser Cys Leu Ser He Thr Trp Thr Leu He 
2505 2510 2515 

aag aac atg gaa aaa cca gga eta aaa aga ggt ggg gca aaa gga cgc 7698 
Lys Asn Met Glu Lys Pro Gly Leu Lys Arg Gly Gly Ala Lys Gly Arg 
2520 2525 2530 

acc ttg gga gag gtt tgg aaa gaa aga etc aac cag atg aca aaa gaa 7746 
Thr Leu Gly Glu Val Trp Lys Glu Arg Leu Asn Gin Met Thr Lys Glu 
2535 2540 2545 2550 

gag ttc act agg tac cgc aaa gag gcc ate ate gaa gtc gat cgc tea 7794 
Glu Phe Thr Arg Tyr Arg Lys Glu Ala He He Glu Val Asp Arg Ser 
2555 2560 2565 

gcg gca aaa cac gcc agg aaa gaa ggc aat gtc act gga ggg cat tea 7842 
Ala Ala Lys His Ala Arg Lys Glu Gly Asn Val Thr Gly Gly His Ser 
2570 2575 2580 

gtc tct agg ggc aca gca aaa ctg aga tgg ctg gtc gaa egg agg ttt 7890 
Val Ser Arg Gly Thr Ala Lys Leu Arg Trp Leu Val Glu Arg Arg Phe 
2585 2590 2595 

etc gaa ccg gtc gga aaa gtg att gac ctt gga tgt gga aga ggc ggt 7938 
Leu Glu Pro Val Gly Lys Val He Asp Leu Gly Cys Gly Arg Gly Gly 
2600 2605 2610 

tgg tgt tac tat atg gca acc caa aaa aga gtc caa gaa gtc aga ggg 7986 
Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg Val Gin Glu Val Arg Gly 
2615 * 2620 2625 2630 

tac aca aag ggc ggt ccc gga cat gaa gag ccc caa eta gtg caa agt 8034 
Tyr Thr Lys Gly Gly Pro Gly His Glu Glu Pro Gin Leu Val Gin Ser 
2635 2640 2645 

tat gga tgg aac att gtc acc atg aag agt gga gtg gat gtg ttc tac 8082 
Tyr Gly Trp Asn He Val Thr Met Lys Ser Gly Val Asp Val Phe Tyr 
2650 2655 2660 

aga cct tct gag tgt tgt gac acc etc ctt tgt gac ate gga gag tec 8130 
Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu Cys Asp He Gly Glu Ser 
2665 2670 2675 

teg tea agt get gag gtt gaa gag cat agg acg att cgt gtc ctt gaa 8178 
Ser Ser Ser Ala Glu Val Glu Glu His Arg Thr He Arg Val Leu Glu 
2680 2685 2690 

atg gtt gag gac tgg ctg cac cga ggg cca agg gaa ttt tgc gtg aag 8226 
Met Val Glu Asp Trp Leu His Arg Gly Pro Arg Glu Phe Cys Val Lys 
2695 2700 2705 2710 
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gtg etc tgc ccc tac atg ccg aaa gtc aca gag aag atg gag ctg etc 3274 
Val Leu Cys Pro Tyr Met Pro Lys Val lie Glu Lys Met Glu Leu Leu 
2715 2720 2725 

caa cgc egg tat ggg ggg gga ctg gtc aga aac cca etc tea egg aat 8322 
Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg Asn Pro Leu Ser Arg Asn 
2730 ' 2735 2740 

tec acg cac gag atg tat tgg gtg agt cga get tea ggc aat gtg gta 8370 
Ser Thr His Glu Met Tyr Trp Val Ser Arg Ala Ser Gly Asn Val Val 
2745 2750 2755 

cat tea gtg aat atg ace age cag gtg etc eta gga aga atg gaa aaa 8418 
His Ser Val Asn Met Thr Ser Gin Val Leu Leu Gly Arg Met Glu Lys 
2760 2765 2770 

agg acc tgg aag gga ccc caa tac gag gaa gat gta aac ttg gga age 84 66 
Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu Asp Val Asn Leu Gly Ser 
2775 * * 2780 2785 2790 

gga acc agg gcg gtg gga aaa ccc ctg etc aac tea gac acc age aaa 8514 
Gly Thr Arg Ala Val Gly Lys Pro Leu Leu Asn Ser Asp Thr Ser Lys 
2795 2800 2805 

ate aac aac agg att gaa cga etc agg cgt gag tac agt teg acg tgg 8562 
He Asn Asn Arg He Glu Arg Leu Arg Arg Glu Tyr Ser Ser Thr Trp 
2810 2815 2820 

cac cac gat gag aac cac cca tat aga acc tgg aac tat cac ggc agt 8610 
His His Asp Glu Asn His Pro Tyr Arg Thr Trp Asn Tyr His Gly Ser 
2825 2830 2835 

tat gat gtg aag ccc aca ggc tec gee agt teg ctg gtc aat gga gtg 8658 
Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser Ser Leu Val Asn Gly Val 
2840 2845 2850 

gtc agg etc etc tea aaa cca tgg gac acc ate acg aat gtt acc acc 8706 
Val Arg Leu Leu Ser Lys Pro Trp Asp Thr He Thr Asn Val Thr Thr 
2855 2860 2865 2870 

atg gee atg act gac act act ccc ttc ggg cag cag cga gtg ttc aaa 8754 
Met Ala Met Thr Asp Thr Thr Pro Phe Gly Gin Gin Arg Val Phe Lys 
2875 2880 2885 

gag aag gtg gac acg aaa get cct gaa ccg cca gaa gga gcg aag tac 8802 
Glu Lys Val Asp Thr Lys Ala Pro Glu Pro Pro Glu Gly Ala Lys Tyr 
2890 2895 2900 

gtg etc aac gag acc acc aac tgg ttg tgg gcg ttt ttg gee aga gaa 8850 
Val Leu Asn Glu Thr Thr Asn Trp Leu Trp Ala Phe Leu Ala Arg Glu 
2905 2910 2915 

aaa cgt ccc aga atg tgc tct cga gag gaa ttc ata aga aag gtc aac 8898 
Lys Arg Pro Arg Met Cys Ser Arg Glu Glu Phe He Arg Lys Val Asn 
2920 2925 2930 

age aat gca get ttg ggt gee atg ttt gaa gag cag aat caa tgg agg 894 6 
Ser Asn Ala Ala Leu Gly Ala Met Phe Glu Glu Gin Asn Gin Trp Arg 
2935 2940 2945 2950 
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age gec aga gaa gca gtt gaa gat cca aaa ttt tgg gag atg gtg gat 8994 
Ser Ala Arg Glu Ala Val Glu Asp Pro Lys Phe Trp Giu Met Val Asp 
2955 2960 2965 

gag gag cgc gag gca cat ccg egg ggg gaa tgt cac act tgc ate tac 9042 
Glu Glu Arg Glu Ala His Leu Arg Gly Glu Cys His Thr Cys lie Tyr 
2970 2975 2980 

aac atg atg gga aag aga gag aaa aaa ccc gga gag ttc gga aag gec 9090 
Asn Met Met Gly Lys Arg Glu Lys Lys Pro Gly Glu Phe Gly Lys Ala 
2985 2990 2995 

aag gga age aga gee att tgg ttc atg tgg etc gga get cgc ttt ctg 9138 
Lys Gly Ser Arg Ala lie Trp Phe Met Trp Leu Gly Ala Arg Phe Leu 
3000 3005 3010 

gag ttc gag get ctg ggt ttt etc aat gaa gac cac tgg ctt gga aga 9186 
Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu Asp His Trp Leu Gly Arg 
3015 3020 3025 3030 

aag aac tea gga gga ggt gtc gag ggc ttg ggc etc caa aaa ctg ggt 9234 
Lys Asn Ser Gly Gly Gly Val Glu Gly Leu Gly Leu Gin Lys Leu Gly 
3035 3040 3045 

tac ate ctg cgt gaa gtt ggc ace egg cct ggg ggc aag ate tat get 9282 
Tyr He Leu Arg Glu Val Gly Thr Arg Pro Gly Gly Lys He Tyr Ala 
3050 3055 3060 

gat gac aca get ggc tgg gac ace cgc ate acg aga get gac ttg gaa 9330 
Asp Asp Thr Ala Gly Trp Asp Thr Arg He Thr Arg Ala Asp Leu Glu 
3065 3070 3075 

aat gaa get aag gtg ctt gag ctg ctt gat ggg gaa cat egg cgt ctt 9378 
Asn Glu Ala Lys Val Leu Glu Leu Leu Asp Gly Glu His Arg Arg Leu 
3080 3085 3090 

gee agg gee ate att gag etc acc tat cgt cac aaa gtt gtg aaa gtg 9426 
Ala Arg Ala He He Glu Leu Thr Tyr Arg His Lys Val Val Lys Val 
3095 3100 3105 3110 

atg cgc ccg get get gat gga aga acc gtc atg gat gtt ate tec aga 9474 
Met Arg Pro Ala Ala Asp Gly Arg Thr Val Met Asp Val He Ser Arg 
3115 3120 3125 

gaa gat cag agg ggg agt gga caa gtt gtc acc tac gee eta aac act 9522 
Glu Asp Gin Arg Gly Ser Gly Gin Val Val Thr Tyr Ala Leu Asn Thr 
3130 3135 3140 

ttc acc aac ctg gee gtc cag ctg gtg agg atg atg gaa ggg gaa gga 9570 
Phe Thr Asn Leu Ala Val Gin Leu Val Arg Met Met Glu Gly Glu Gly 
3145 3150 3155 

gtg att ggc cca gat gat gtg gag aaa etc aca aaa ggg aaa gga ccc 9618 
Val He Gly Pro Asp Asp Val Glu Lys Leu Thr Lys Gly Lys Gly Pro 
3160 3165 3170 

aaa gtc agg acc tgg ctg ttt gag aat ggg gaa gaa aga etc age cgc 9666 
Lys Val Arg Thr Trp Leu Phe Glu Asn Gly Glu Glu Arg Leu Ser Arg 
3175 3180 3185 3190 
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atg get gtc agt gga gat gac tgt gcg gta aag ccc ctg gac gat cgc 
Met Ala Val Ser Gly Asp Asp Cys Val Val Lys Pro Leu Asp Asp Arg 
3195 3200 3205 



9714 



ttt gec acc teg ccc cac etc etc aat get atg tea aag gtt cgc aaa 
Phe Ala Thr Ser Leu His Phe Leu Asn Ala Met Ser Lys Val Arg Lys 
3210 3215 3220 



9762 



gac ate caa gag tgg aaa ccg tea act gga tgg tat gat tgg cag cag 
Asp He Gin Glu Trp Lys Pro Ser Thr Gly Trp Tyr Asp Trp Gin Gin 
3225 3230 3235 



9810 



gtt cca ttt tgc tea aac cat ttc acc gaa ttg ate atg aaa gat gga 
Val Pro Phe Cys Ser Asn His Phe Thr Glu Leu He Met Lys Asp Gly 
3240 3245 3250 



9858 



aga aca ctg gtg get cca tgc cca gga cag gat gaa ttg gta ggc aga 
Arg Thr Leu Val Val Pro Cys Arg Gly Gin Asp Glu Leu Vai Gly Arg 
3255 3260 3265 3270 



9906 



get cgc ata tct cca ggg gee gga tgg aac gtc cgc gac act get tgc 
Ala Arg He Ser Pro Gly Ala Gly Trp Asn Val Arg Asp Thr Ala Cys 
3275 3280 3285 



9954 



ctg get aag tct tat gee cag atg egg ctg ctt ctg tac ttc cac aga 
Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu Leu Leu Tyr Phe His Arg 
3290 3295 3300 



10002 



aga gac ctg egg etc atg gee aac gee att tgc tec get gtc cct gtg 
Arg Asp Leu Arg Leu Met Ala Asn Ala lie Cys Ser Ala Val Pro Val 
3305 3310 3315 



10050 



aat tgg gtc cct acc gga aga acc acg tgg tec ate cat gca gga gga 
Asn Trp Val Pro Thr Gly Arg Thr Thr Trp Ser He His Ala Gly Gly 
3320 3325 3330 



10098 



gag tgg atg aca aca gag gac atg ttg gag gtc tgg aac cgt gtt tgg 
Glu Trp Met Thr Thr Glu Asp Met Leu Glu Val Trp Asn Arg Val Trp 
3335 3340 3345 3350 



10146 



ata gag gag aat gaa tgg atg gaa gac aaa acc cca gtg gag aaa tgg 
He Glu Glu Asn Glu Trp Met Glu Asp Lys Thr Pro Val Glu Lys Trp 
3355 3360 3365 



10194 



agt gac gtc cca tat tea gga aaa cga gag gac ate tgg tgt ggc age 10242 
Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu Asp He Trp Cys Gly Ser 
3370 3375 3380 



ctg att ggc aca aga gec cga gee acg tgg gca gaa aac ate cag gtg 
Leu He Gly Thr Arg Ala Arg Ala Thr Trp Ala Glu Asn He Gin Val 
3385 3390 3395 



10290 



get ate aac caa gtc aga gca ate ate gga gat gag aag tat gtg gat 
Ala He Asn Gin Val Arg Ala He lie Gly Asp Glu Lys Tyr Val Asp 
3400 3405 3410 



10338 



tac atg agt tea eta aag aga tat gaa gac aca act ttg gtt gag gac 
Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp Thr Thr Leu Val Glu Asp 
3415 3420 3425 3430 



10386 
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aca gta ctg tagatattta atcaattgta aatagacaat ataagtatgc 10435 
Thr Val Leu 

ataaaagtgt agttttatag tagtatttag tggtgttagt gtaaatagtt aagaaaattt 10495 
tgaggagaaa gtcaggccgg gaagttcccg ccaccggaag ttgagtagac ggtgctgcct 10555 
gcgactcaac cccaggagga ctgggtgaac aaagccgcga agtgatccat gtaagccctc 10615 
agaaccgtct cggaaggagg accccacatg ttgtaacttc aaagcccaat gtcagaccac 10675 
gctacggcgt gctactctgc ggagagtgca gtctgcgata gtgccccagg aggactgggt 10735 
taacaaaggc aaaccaacgc cccacgcggc cctagccccg gtaatggtgt taaccagggc 10795 
gaaaggacta gaggttagag gagaccccgc ggtttaaagt gcacggccca gcctgactga 10855 
agctgtaggt • caggggaagg actagaggtt agtggagacc ccgtgccaca aaacaccaca 10915 
acaaaacagc atattgacac ctgggataga ctaggagatc ttctgctctg cacaaccagc 10975 
cacacggcac agtgcgccga caatggtggc tggcggtgcg agaacacagg atct 11029 

<210> 2 
<211> 3433 
<212> PRT 

<213> Flavivirus sp. 
<400> 2 

Met Ser Lys Lys Pro Glv Gly Pro Gly Lys Ser Arg Ala Val Asn Met 
15 10 15 

Leu Lys Arg Gly Met Pro Arg Val Leu Ser Leu He Gly Leu Lys Arg 
20 25 30 

Ala Met Leu Ser Leu He Asp Gly Lys Gly Pro lie Arg Phe Val Leu 
35 40 45 

Ala Leu Leu Ala Phe Phe Arg Phe Thr Ala He Ala Pro Thr Arg Ala 
50 55 60 

Val Leu Asp Arg Trp Arg Gly Val Asn Lys Gin Thr Ala Met Lys His 
65 70 75 80 

Leu Leu Ser Phe Lys Lys Glu Leu Gly Thr Leu Thr Ser Ala lie Asn 
85 90 95 

Arg Arg Ser Ser Lys Gin Lys Lys Arg Gly Gly Lys Thr Gly He Ala 
100 105 110 

Val Met He Gly Leu He Ala Ser Val Gly Ala Val Thr Leu Ser Asn 
115 120 125 

Phe Gin Gly Lys Val Met Met Thr Val Asn Ala Thr Asp Val Thr Asp 
130 * 135 140 



Val He Thr He Pro Thr Ala Ala Gly Lys Asn Leu Cys He Val Arg 
145 150 155 160 
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Ala Met Asp Val Gly Tyr Met Cys Asp Asp Thr He Thr Tyr Glu Cys 
165 170 175 

Pro Val Leu Ser Ala Gly Asn Asp Pro Glu Asp He Asp Cys Trp Cys 
180 185 190 

Thr Lys Ser Ala Val Tyr Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg 
195 200 205 

His Ser Arg Arg Ser Arg Arg Ser Leu Thr Val Gin Thr Kis Gly Glu 
210 ' 215 220 

Ser Thr Leu Ala Asn Lys Lys Gly Ala Trp Met Asp Ser Thr Lys Ala 
225 230 235 240 

Thr Arg Tyr Leu Val Lys Thr Glu Ser Trp He Leu Arg Asn Pro Gly 
245 250 255 

Tyr Ala Leu Val Ala Ala Val He Gly Trp Met Leu Gly Ser Asn Thr 
260 265 270 

Met Gin Arg Val Val Phe Val Val Leu Leu Leu Leu Val Ala Pro Ala 
275 280 285 

Tyr Ser Phe Asn Cys Leu Gly Met Ser Asn Arg Asp Phe Leu Glu Gly 
290 295 300 

Val Ser Gly Ala Thr Tro Val Asp Leu Val Leu Glu Gly Asp Ser Cys 
305 310 315 320 

Val Thr He Met Ser Lys Asp Lys Pro Thr He Asp Val Lys Met Met 
325 330 335 

Asn Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu 
340 345 350 

Ala Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly 
355 360 365 

Glu Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gin 
370 375 380 

Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys 
385 390 395 400 

Gly Ser He Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala He 
405 410 415 

Gly Arg Thr He Leu Lys Glu Asn He Lys Tyr Glu Val Ala He Phe 
420 425 430 

Val His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gin 
435 440 445 

Val Gly Ala Thr Gin Ala Gly Arg Phe Ser He Thr Pro Ala Ala Pro 
450 455 460 

Ser Tyr Thr Leu Lys Lea Gly Glu Tyr Gly Glu Val Thr Val Asp Cys 
465 470 475 480 
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Glu Pro Arg Ser Gly He Asp Thr Asn Ala Tyr Tyr Val Met Thr Val 

485 490 495 

Gly Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn 

500 505 510 

Leu Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr 

515 520 525 

Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gin Ser Val He Ala 

530 535 540 

Leu Gly Ser Gin Glu Gly Ala Leu His Gin Ala Leu Ala Gly Ala He 

545 550 555 560 

Pro Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu 

565 570 575 

Lys Cys Arg Val Lys Met Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr 



Gly His Gly Thr Val Val Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly 
610 615 620 

Pro Cys Lys Val Pro He Ser Ser Val Ala Ser Leu Asn Asp Leu Thr 
625 630 635 640 

Pro Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr 
645 650 655 

Ala Asn Ala Lys Val Leu He Glu Leu Glu Pro Pro Phe Gly Asp Ser 
660 665 670 

Tyr He Val Val Gly Arg Gly Glu Gin Gin He Asn His His Trp His 
675 680 685 

Lys Ser Gly Ser Ser He Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly 
690 695 700 

Ala Gin Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser 
705 ' 710 715 720 

Val Gly Gly Val Phe Thr Ser Val Gly Lys Ala Val His Gin Val Phe 
725 730 735 

Gly Gly Ala Phe Arg Ser Leu Phe Gly Gly Met Ser Trp He Thr Gin 
740 745 750 

Gly Leu Leu Gly Ala Leu Leu Leu Trp Met Gly He Asn Ala Arg Asp 
755 760 765 

Arg Ser He Ala Leu Thr Phe Leu Ala Val Gly Gly Val Leu Leu Phe 
770 775 780 

Leu Ser Val Asn Val His Ala Asp Thr Gly Cys Ala He Asp He Ser 
785 790 795 800 



580 



535 



590 



Gly Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr 
595 600 605 
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Arg Gin Glu Leu Arg Cys Gly Asn Gly Val Phe He His Asn Asp Val 
805 810 815 

Glu Ala Trp Met Asp Arg Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly 
820 825 830 

Leu Ala Lys He He Gin Lys Ala His Lys Glu Gly Val Cys Gly Leu 
835 840 845 

Arg Ser Val Ser Arg Leu Glu His Gin Met Trp Glu Ala Val Lys Asp 
850 855 860 

Glu Leu Asn Thr Leu Leu Lys Glu Asn Gly Val Asp Leu Ser Val Val 
865 870 875 880 

Val Glu Lys Gin Glu Gly Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr 
885 ' 890 895 

Ala Thr Thr Glu Lys Leu Glu lie Gly Trp Lys Ala Trp Gly Lys Ser 
900 905 910 

He Leu Phe Ala Pro Glu Leu Ala Asn Asn Thr Phe Val Val Asp Gly 
915 920 925 

Pro Glu Thr Lys Glu Cys Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu 
930 935 940 

Glu Val Glu Asp Phe Gly Phe Gly Leu Thr Ser Thr Arg Met Phe Leu 
945 950 955 960 

Lys Val Arg Glu Ser Asn Thr Thr Glu Cys Asp Ser Lys He He Gly 
965 970 975 

Thr Ala Val Lys Asn Asn Leu Ala He His Ser Asp Leu Ser Tyr Trp 
980 985 990 

He Glu Ser Arg Leu Asn Asp Thr Trp Lys Leu Glu Arg Ala Val Leu 
995 1000 1005 

Gly Glu Val Lys Ser Cys Thr Trp Pro Glu Thr His Thr Leu Trp Gly 
1010 1015 1020 

Asp Gly He Leu Glu Ser Asp Leu He lie Pro Val Thr Leu Ala Gly 
025 * 1030 1035 1040 

Pro Arg Ser Asn His Asn Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin 
1045 1050 1055 

Gly Pro Trp Asp Glu Gly Arg Val Glu He Asp Phe Asp Tyr Cys Pro 
1060 1065 1070 

Gly Thr Thr Val Thr Leu Ser Glu Ser Cys Gly His Arg Gly Pro Ala 
1075 1080 1085 

Thr Arg Thr Thr Thr Glu Ser Gly Lys Leu He Thr Asp Trp Cys Cys 
1090 1095 1100 

Arg Ser Cys Thr Leu Pro Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys 
105 1110 1115 1120 



WO 02/081511 




PCTV 




foll68 



20/29 



Trp Tyr Gly Met Glu lie Arg Pro Gin Arg His Asp Glu Lys Thr Leu 
1125 1130 1135 

Val Gin Ser Gin Val Asn Ala Tyr Asn Ala Asp Met lie Asp Pro Phe 
1140 1145 1150 

Gin Leu Gly Leu Leu Val Val Phe Leu Ala Thr Gin Glu Val Leu Arg 
1155 1160 1165 

Lys Arg Trp Thr Ala Lys lie Ser Met Pro Ala He Leu He Ala Leu 
1170 1175 1180 

Leu Val Leu Val Phe Gly Gly He Thr Tyr Thr Asp Val Leu Arg Tyr 
185 1190 1195 1200 

Val He Leu Val Gly Ala Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp 
1205 1210 1215 

Val Val His Leu Ala Leu Met Ala Thr Phe Lys He Gin Pro Val Phe 
1220 1225 1230 

Met Val Ala Ser Phe Leu Lys Ala Arg Trp Thr Asn Gin Glu Asn He 
1235 1240 1245 

Leu Leu Met Leu Ala Ala Val Phe Phe Gin Met Ala Tyr His Asp Ala 
1250 1255 1260 

Arg Gin He Leu Leu Trp Glu He Pro Asp Val Leu Asn Ser Leu Ala 
265 1270 1275 1280 

Val Ala Trp Met He Leu Arg Ala He Thr Phe Thr Thr Thr Ser Asn 
1285 1290 1295 

Val Val Val Pro Leu Leu Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu 
1300 1305 ^ 1310 

Asn Leu Asp Val Tyr Arg He Leu' Leu Leu Met Val Gly He Gly Ser 
1315 1320 1325 

Leu He Arg Glu Lys Arg Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser 
1330 1335 1340 

Leu Leu Cys Leu Ala Leu Ala Ser Thr Gly Leu Phe Asn Pro Met He 
345 1350 1355 1360 

Leu Ala Ala Gly Leu He Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp 
1365 1370 1375 

Pro Ala Thr Glu Val Met Thr Ala Val Gly Leu Met Phe Ala He Val 
1380 1385 1390 

Gly Gly Leu Ala Glu Leu Asp He Asp Ser Met Ala lie Pro Met Thr 
1395 1400 1405 

He Ala Gly Leu Met Phe Ala Ala Phe Val lie Ser Gly Lys Ser Thr 
1410 1415 1420 



Asp Met Trp He Glu Arg Thr Ala Asp lie Ser Trp Glu Ser Asp Ala 
425 1430 1435 1440 
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Glu lie Thr Gly Ser Ser Glu Arg Val Asp Val Arg Leu Asp Asp Gly 
1445 1450 1455 

Glu Asn Phe Gin Leu Met Asn Asp Pro Gly Ala Pro Trp Lys lie Trp 
1460 1465 1470 

Met Leu Arg Met Val Cys Leu Ala lie Ser Ala Tyr Thr Pro Trp Ala 
1475 1480 1485 

He Leu Pro Ser Val Val Gly Phe Trp He Thr Leu Gin Tyr Thr Lys 
1490 1495 1500 

Arg Gly Gly Val Leu Trp Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys 
505 1510 1515 1520 

Gly Asp Thr Thr Thr Gly Val Tyr Arg He Met Thr Arg Gly Leu Leu 
1525 1530 1535 

Gly Ser Tyr Gin Ala Gly Ala Gly Val Met Val Glu Gly Val Phe His 
1540 1545 ' 1550 

Thr Leu Trp His Thr Thr Lys Gly Ala Ala Leu Met Ser Gly Glu Gly 
1555 1560 1565 

Arg Leu Asp Pro. Tyr Trp Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr 
1570 1575 1580 

Gly Gly Pro Trp Lys Leu Gin His Lys Trp Asn Gly Gin Asp Glu Val 
585 1590 1595 1600 

Gin Met He Val Vai Glu Pro Gly Lvs Asn Val Lys Asn Val Gin Thr 
1605 1610 1615 

Lys Pro Gly Val Phe Lys Thr Pro Glu Gly Glu lie Gly Ala Val Thr 
1620 1625 1630 

Leu Asp Phe Pro Thr Gly Thr Ser Gly Ser Pro He Val Asp Lys Asn 
1635 1640 1645 

Gly Asp Val He Gly Leu Tyr Gly Asn Gly Val He Met Pro Asn Gly 
1650 1655 1660 

Ser Tyr He Ser Ala He Val Gin Gly Glu Arg Met Asp Glu Pro He 
665 1670 1675 1680 

Pro Ala Gly Phe Glu Pro Glu Met Leu Arg Lys Lys Gin He Thr Val 



Leu Asp Leu His Pro Gly Ala Gly Lys Thr Arg Arg He Leu Pro Gin 
1700 1705 1710 

He He Lys Glu Ala He Asn Arg Arg Leu Arg Thr Ala Val Leu Ala 
1715 1720 1725 

Pro Thr Arg Val Val Ala Ala Glu Met Ala Glu Ala Leu Arg Gly Leu 



1685 



1690 



1695 



1730 



1735 



1740 



Pro He Arg Tyr Gin Thr Ser Ala Val Pro Arg Glu His Asn Gly Asn 
745 1750 1755 1760 
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Glu lie Val Asp Val Met Cys His Ala Thr Leu Thr His Arg Leu Met 
1765 1770 1775 

Ser Pro His Arg Val Pro Asn Tyr Asn Leu Phe Val Met Asp Glu Ala 
1780 1735 1790 

His Phe Thr Asp Pro Ala Ser He Ala Ala Arg Gly Tyr He Ser Thr 
1795 1800 1805 

Lys Val Glu Leu Gly Glu Ala Ala Ala He Phe Met Thr Ala Thr Pro 
1810 1815 1820 

Pro Gly Thr Ser Asp Pro Phe Pro Glu Ser Asn Ser Pro He Ser Asp 
825 ^ 1830 1835 1840 

Leu Gin Thr Glu He Pro Asp Arg Ala Trp Asn Ser Giy Tyr Glu Trp 



Met Gly Asn Glu lie Ala Leu Cys Leu Gin Arg Ala Gly Lys Lys Val 
1875 1880 1885 

Val Gin Leu Asn Arg Lys Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys 
1890 1895 1900 

Asn Asp Asp Trp Asp Phe Val lie Thr Thr Asp He Ser Glu Met Gly 
905 1910 1915 1920 

Ala Asn Phe Lys Ala Ser Arg Val lie Asp Ser Arg Lys Ser Val Lys 
1925 1930 1935 

Pro Thr He He Thr Glu Gly Glu Gly Arg Val He Leu Gly Glu Pro 
1940 1945 1950 

Ser Ala Val Thr Ala Ala Ser Ala Ala Gin Arg Arg Gly Arg He Gly 
1955 1960 1965 

Arg Asn Pro Ser Gin Val Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr 
1970 1975 1980 

Asn Glu Asp Asp Ser Asn Phe Ala His Trp Thr Glu Ala Arg lie Met 
985 1990 1995 2000 

Pro Asp Asn lie Asn Met Pro Asn Gly Leu lie Ala Gin Phe Tyr Gin 
2005 2010 2015 

Pro Glu Arg Glu Lys Val Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg 
2020 2025 2030 

Gly Glu Glu Arg Lys Asn Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu 
2035 " 2040 2045 

Pro Val Trp Leu Ala Tyr Lys Val Ala Ala Ala Gly Val Ser Tyr His 
2050 2055 2060 



1845 



1850 



1855 



He Thr Glu Tyr Thr 
1860 



Gly Lys Thr Val Trp Phe Val Pro Ser Val Lys 
1865 1870 



Asp Arg Arg Trp Cys Phe Asp Gly Pro Arg Thr Asn Thr lie Leu Glu 
065 2070 2075 2080 
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AspAsn Asn Glu Val Glu Val lie Thr Lys Leu Gly Glu Arg Lys lie 
2085 2090 2095 

Leu Arg Pro Arg Trp lie Asp Ala Arg Val Tyr Ser Asp His Gin Ala 
2100 2105 2110 

Leu Lys Ala Phe Lys Asp Phe Ala Ser Gly Lys Arg Ser Gin lie Gly 
2115 * 2120 2125 

Leu He Glu Val Leu Gly Lys Met Pro Glu His Phe Met Gly Lys Thr 
2130 2135 2140 

Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr Ala Glu Lys Gly 
145 2150 2155 2160 

Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin 
2165 2170 2175 

Thr He Ala Leu He Ala Leu Leu Ser Val Met Thr Met Gly Val Phe 
2180 2185 2190 

Phe Leu Leu Met Gin Arg Lys Gly He Gly Lys lie Gly Leu Gly Gly 
2195 2200 2205 

Ala Val Leu Gly Val Ala Thr Phe Phe Cys Trp Met Ala Glu Val Pro 
2210 2215 2220 

Gly Thr Lys lie Ala Gly Met Leu Leu Leu Ser Leu Leu Leu Met lie 
225 ~ 2230 2235 2240 

Val Leu lie Pro Glu Pro Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin 
2245 2250 2255 

Leu Ala Val Phe Leu lie Cys Val Met Thr Leu Val Ser Ala Val Ala 
2260 2265 2270 

Ala Asn Glu Met Gly Trp Leu Asp Lys Thr Lys Ser Asp lie Ser Ser 
2275 " 2280 2285 

Leu Phe Gly Gin Arg lie Glu Val Lys Glu Asn Phe Ser Met Gly Glu 
2290 2295 2300 

Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val 
305 2310 2315 2320 

Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu lie Thr Ser Asp 
2325 2330 2335 

Tyr He Asn Thr Ser Leu Thr Ser lie Asn Val Gin Ala Ser Ala Leu 
2340 2345 2350 

Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala 
2355 2360 2365 

Leu Leu Leu Ala Ala Gly Cys Trp Gly Gin Val Thr Leu Thr Val Thr 
2370 2375 2380 



Val Thr Ala Ala Thr Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro 
385 2390 2395 2400 



« 
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Gly Trp Gin Ala Glu Ala Met Arg Ser Ala Gin Arg Arg Thr Ala Ala 
2405 2410 2415 

Gly He Met Lys Asn Ala Val Val Asp Gly He Val Ala Thr Asp Val 
2420 2425 2430 

Pro Glu Leu Glu Arg Thr Thr Pro He Met Gin Lys Lys Val Gly Gin 
2435 2440 2445 

He Met Leu He Leu Val Ser Leu Ala Ala Val Val Val Asn Pro Ser 
2450 2455 2460 

Val Lys Thr Val Arg Glu Ala Gly He Leu He Thr Ala Ala Ala Val 
465 2470 2475 2480 

Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala 
2485 2490 2495 

lie Gly Leu Cys His He Met Arg Gly Gly Trp Leu Ser Cys Leu Ser 
2500 2505 2510 

lie Thr Trp Thr Leu He Lys Asn Met Glu Lys Pro Gly Leu Lys Arg 
2515 2520 2525 

Gly Gly Ala Lys Gly Arg Thr Leu Gly Glu Val Trp Lys Glu Arg Leu 
2530 ' 2535 2540 

Asn Gin Met Thr Lys Glu Glu Phe Thr Arg Tyr Arg Lys Glu Ala He 
545 ' 2550 2555 2560 

He Glu Val Asp Arg Ser Ala Ala Lys His Ala Arg Lys Glu Gly Asn 
2565 2570 ' 2575 

Val Thr Gly Gly His Ser Val Ser Arg Gly Thr Ala Lys Leu Arg Trp 
2580 2585 2590 

Leu Val Glu Arg Arg Phe Leu Glu Pro Val Gly Lys Val He Asp Leu 
2595 2600 2605 

Gly Cys Gly Arg Gly Gly Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg 
2610 2615 2620 

Val Gin Glu Val Arg Gly Tyr Thr Lys Gly Gly Pro Gly His Glu Glu 
625 2630 2635 2640 

Pro Gin Leu Val Gin Ser Tyr Gly Trp Asn He Val Thr Met Lys Ser 
2645 2650 2655 

Gly Val Asp Val Phe Tyr Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu 
2660 2665 2670 

Cys Asp He Gly Glu Ser Ser Ser Ser Ala Glu Val Glu Glu His Arg 
2675 2680 2685 

Thr He Arg Val Leu Glu Met Val Glu Asp Trp Leu His Arg Gly Pro 
2690 2695 2700 



Arg Glu Phe Cys Val Lys Val Leu Cys Pro Tyr Met Pro Lys Val He 
705 2710 2715 2720 
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Glu Lys Met Glu Leu Leu Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg 
2725 2730 2735 

Asn Pro Leu Ser Arg Asn Ser Thr His Glu Met Tyr Trp Val Ser Arg 
2740 2745 2750 

Ala Ser Gly Asn Val Val His Ser Val Asn Met Thr Ser Gin Val Leu 
2755 2760 2765 

Leu Gly Arg Met Glu Lys Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu 
2770 2775 2780 

Asp Val Asn Leu Gly Ser Gly Thr Arg Ala Val Gly Lys Pro Leu Leu 
785 2790 2795 2800 

Asn Ser Asp Thr Ser Lys He Asn Asn Arg He Glu Arg Leu Arg Arg 
2805 2810 2815 

Glu Tyr Ser Ser Thr Trp His His Asp Glu Asn His Pro Tyr Arg Thr 
2820 2825 2830 

Trp Asn Tyr His Gly Ser Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser 
2835 2840 2845 

Ser Leu Val Asn Gly Val Val Arg Leu Leu Ser Lys Pro Trp Asp Thr 
2850 2855 2860 

He Thr Asn Val Thr Thr Met Ala Met Thr Asp Thr Thr Pro Phe Gly 
865 2870 2875 2880 

Gin Gin Arg Val Phe Lys Glu Lys Val Asp Thr Lys Ala Pro Glu Pro 
2885 2890 2895 

Pro Glu Gly Ala Lys Tyr Val Leu Asn Glu Thr Thr Asn Trp Leu Trp 
2900 2905 2910 

Ala Phe Leu Ala Arg Glu Lys Arg Pro Arg Met Cys Ser Arg Glu Glu 
2915 2920 2925 

Phe He Arg Lys Val Asn Ser Asn Ala Ala Leu Gly Ala Met Phe Glu 
2930 " 2935 2940 

Glu Gin Asn Gin Trp Arg Ser Ala Arg Glu Ala Val Glu Asp Pro Lys 
945 2950 2955 2960 

Phe Trp Glu Met Val Asp Glu Glu Arg Glu Ala His Leu Arg Gly Glu 
2965 2970 2975 

Cys His Thr Cys He Tyr Asn Met Met Gly Lys Arg Glu Lys Lys Pro 
2980 2985 2990 

Gly Glu Phe Gly Lys Ala Lys Gly Ser Arg Ala He Trp Phe Met Trp 
2995 3000 3005 

Leu Gly Ala Arg Phe Leu Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu 
3010 3015 3020 



Asp His Trp Leu Gly Arg Lys Asn Ser Gly Gly Gly Val Glu Gly Leu 
025 3030 3035 "* 3040 
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Gly Leu Gin Lys Leu Gly Tyr He Leu Arg Glu Val Gly Thr Arg Pro 
3045 3050 3055 

Gly Gly Lys He Tyr Ala Asp Asp Thr Ala Gly Trp Asp Thr Arg He 
3060 3065 3070 

Thr Arg Ala Asp Leu Glu Asn Glu Ala Lys Val Leu Glu Leu Leu Asp 
3075 3080 3085 

Gly Glu His Arg Arg Leu Ala Arg Ala He He Glu Leu Thr Tyr Arg 
3090 " 3095 3100 

His Lys Val Val Lys Val Met Arg Pro Ala Ala Asp Gly Arg Thr Val 
105 3110 3115 3120 

Met Asp Val He Ser Arg Glu Asp Gin Arg Gly Ser Gly Gin Val Val 
3125 3130 3135 

Thr Tyr Ala Leu Asn Thr Phe Thr Asn Leu Ala Val Gin Leu Val Arg 
3140 3145 3150 

Met Met Glu Gly Glu Gly Val lie Gly Pro Asp Asp Val Glu Lys Leu 
3155 ~ 3160 3165 

Thr Lys Gly Lys Gly Pro Lys Val Arg Thr Trp Leu Phe Glu Asn Gly 
3170 3175 3180 

Glu Glu Arg Leu Ser Arg Met Ala Val Ser Gly Asp Asp Cys Val Val 
185 3190 3195 3200 

Lys Pro Leu Asp Asp Arg Phe Ala Thr Ser Leu His Phe Leu Asn Ala 
3205 3210 3215 

Met Ser Lys Val Arg Lys Asp He Gin Glu Trp Lys Pro Ser Thr Gly 
3220 3225 3230 

Trp Tyr Asp Trp Gin Gin Val Pro Phe Cys Ser Asn His Phe Thr Glu 
3235 3240 3245 

Leu He Met Lys Asp Gly Arg Thr Leu Val Val Pro Cys Arg Gly Gin 
3250 3255 3260 

Asp Glu Leu Val Gly Arg Ala Arg He Ser Pro Gly Ala Gly Trp Asn 
265 3270 3275 3280 

Val Arg Asp Thr Ala Cys Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu 
3285 3290 3295 

Leu Leu Tyr Phe His Arg Arg Asp Leu Arg Leu Met Ala Asn Ala He 
3300 3305 3310 

Cys Ser Ala Val Pro Val Asn Trp Val Pro Thr Gly Arg Thr Thr Trp 
3315 3320 3325 

Ser He His Ala Gly Gly Glu Trp Met Thr Thr Glu Asp Met Leu Glu 
3330 3335 3340 



Val Trp Asn Arg Val Trp He Glu Glu Asn Glu Trp Met Glu Asp Lys 
345 3350 3355 3360 
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Thr Pro Val Glu Lys Trp Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu 
3365 3370 3375 

Asp lie Trp Cys Gly Ser Leu lie Gly Thr Arg Ala Arg Ala Thr Trp 
3380 3385 3390 

Ala Glu Asn lie Gin Val Ala lie Asn Gin Val Arg Ala He He Gly 
3395 3400 3405 

Asp Glu Lys Tyr Val Asp Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp 
3410 3415 3420 

Thr Thr Leu Val Glu Asp Thr Val Leu 
425 3430 



<210> 3 
<211> 37 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : AMORCE 
OLIGONUCLEOTIDIQUE 

<400> 3 

tagcacgaag aattcgatgt ctaagaaacc aggaggg 37 



<210> 4 
<211> 50 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : AMORCE 
OLIGONUCLEOTIDIQUE 

<400> 4 

aagttagccc gggttaatgc tcctacgctg gcgatcaggc caatcaggac 50 



<210> 5 
<211> 28 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 5 

agtagttcgc ctgtgtgagc tgacaaac 28 



<210> 6 
<211> 29 
<212> ADN 

<213> Sequence artificielle 



<220> 
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<223> Description de la sequence artif icielle : amorce 



<400> 6 

agatcctgtg ttctcgcacc accagccac 



29 



<2i0> 7 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 7 

ggatggatgctwggJcagc aac 21 

<210> 8 
<211> 19 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 



<210> 9 
<211> 30 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle : amorce 
<400> 9 

tggatgggat ccaatatgcg tgataggtcc 30 



<210> 10 
<211> 39 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 



<400> 8 

ccatccaagc ctccacatc 



19 



<400> 10 

aaaagggtca atggtaccag cattttaagc attcacgtt 



39 



<210> 11 
<211> 36 
<212> ADN 



<213> Sequence artificielle 



<220> 

<223> Description de la sequence artif icielle : amorce 
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<400> 11 

tagcacgaagaattcgatgtctaaaaaccaggaggg 



36 
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